-
python+selenium识别验证码并登录的示例代码
所属栏目:[Python] 日期:2020-12-17 热度:181
由于工作需要,登录网站需要用到验证码。最初是研究过验证码识别的,但是总是不能获取到我需要的那个验证码。直到这周五,才想起这事来,昨天顺利的解决了。 下面正题: python版本:3.4.3 所需要的代码库:PIL,selenium,tesseract 先上代码: #coding:utf[详细]
-
python实现kMeans算法
所属栏目:[Python] 日期:2020-12-17 热度:124
聚类是一种无监督的学习,将相似的对象放到同一簇中,有点像是全自动分类,簇内的对象越相似,簇间的对象差别越大,则聚类效果越好。 1、k均值聚类算法 k均值聚类将数据分为k个簇,每个簇通过其质心,即簇中所有点的中心来描述。首先随机确定k个初始点作为质[详细]
-
TF-IDF与余弦相似性的应用(二) 找出相似文章
所属栏目:[Python] 日期:2020-12-17 热度:50
上一次,我用TF-IDF算法自动提取关键词。 今天,我们再来研究另一个相关的问题。有些时候,除了找到关键词,我们还希望找到与原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 为了找出相似的文章,需要用到"余弦相似性"(cos[详细]
-
Python人脸识别初探
所属栏目:[Python] 日期:2020-12-17 热度:90
本文实例为大家分享了Python人脸识别的具体代码,供大家参考,具体内容如下 1.利用opencv库 sudo apt-get install libopencv-*sudo apt-get install python-opencvsudo apt-get install python-numpy 2 .Python实现 import osimport osfrom PIL import Image[详细]
-
python利用OpenCV2实现人脸检测
所属栏目:[Python] 日期:2020-12-17 热度:169
最近,带领我的学生进行一个URTP项目设计,需要进行人脸识别。由于现在的OpenCV已经到了2.X版本,因此就不想用原来的1.X版本的代码,而网上存在的代码都是1.X版本的代码,尝试自己写一段2.X版本的代码,反复查阅资料,今天终于测试成功(很明显2.X版本的代码[详细]
-
Python判断文件和字符串编码类型的实例
所属栏目:[Python] 日期:2020-12-17 热度:176
python判断文件和字符串编码类型可以用chardet工具包,可以识别大多数的编码类型。但是前几天在读取一个Windows记事本保存的txt文件时,GBK却被识别成了KOI8-R,无解。 然后就自己写了个简单的编码识别方法,代码如下: coding.py # 说明:UTF兼容ISO8859-1[详细]
-
基于Python的文件类型和字符串详解
所属栏目:[Python] 日期:2020-12-17 热度:115
1. Python的文件类型 1. 源代码--直接由Python解析 vi 1.py #!/usr/bin/pythonprint 'hello world' 这里的1.py就是源代码 执行方式和shell脚本类似: chmod +x 后,./1.py Python 1.py 2. 字节代码 Python源码文件经编译后生成的扩展名为pyc的文件 编译方法[详细]
-
Python之Scrapy爬虫框架安装及简单使用详解
所属栏目:[Python] 日期:2020-12-17 热度:160
题记:早已听闻python爬虫框架的大名。近些天学习了下其中的Scrapy爬虫框架,将自己理解的跟大家分享。有表述不当之处,望大神们斧正。 一、初窥Scrapy Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架。 可以应用在包括数据挖掘,信息处理或[详细]
-
Python实现控制台中的进度条功能代码
所属栏目:[Python] 日期:2020-12-17 热度:142
进度条最主要的问题就是所有字符全部在同一行,而且可以修改。 然而当执行print语句的时候,python会在打印完这个语句的同时在结尾加上‘n',也就是换行,这就导致在控制台下一旦被print之后就无法再修改了。所以我们现在的输出就不能再使用print来完成了。[详细]
-
Python文本特征抽取与向量化算法学习
所属栏目:[Python] 日期:2020-12-17 热度:55
本文为大家分享了Python文本特征抽取与向量化的具体代码,供大家参考,具体内容如下 假设我们刚看完诺兰的大片《星际穿越》,设想如何让机器来自动分析各位观众对电影的评价到底是“赞”(positive)还是“踩”(negative)呢? 这类问题就属于情感分析问题[详细]
-
python3写爬取B站视频弹幕功能
所属栏目:[Python] 日期:2020-12-17 热度:177
需要准备的环境: 一个B站账号,需要先登录,否则不能查看历史弹幕记录 联网的电脑和顺手的浏览器,我用的Chrome Python3环境以及request模块,安装使用命令,换源比较快: pip3 install request -i http://pypi.douban.com/simple 爬取步骤: 登录后打开需要爬取的[详细]
-
机器学习经典算法-logistic回归代码详解
所属栏目:[Python] 日期:2020-12-17 热度:96
一、算法简要 我们希望有这么一种函数:接受输入然后预测出类别,这样用于分类。这里,用到了数学中的sigmoid函数,sigmoid函数的具体表达式和函数图象如下: 可以较为清楚的看到,当输入的x小于0时,函数值0.5,将分类预测为0;当输入的x大于0时,函数值0.5[详细]
-
python队列通信:rabbitMQ的使用(实例讲解)
所属栏目:[Python] 日期:2020-12-17 热度:133
(一)、前言 为什么引入消息队列? 1.程序解耦 2.提升性能 3.降低多业务逻辑复杂度 (二)、python操作rabbit mq rabbitmq配置安装基本使用参见上节文章,不再复述。 若想使用python操作rabbitmq,需安装pika模块,直接pip安装: pip install pika 1.最简单[详细]
-
python实现数据预处理之填充缺失值的示例
所属栏目:[Python] 日期:2020-12-17 热度:83
1、给定一个数据集noise-data-1.txt,该数据集中保护大量的缺失值(空格、不完整值等)。利用“全局常量”、“均值或者中位数”来填充缺失值。 noise-data-1.txt: 5.1 3.5 1.4 0.24.9 3 1.4 0.24.7 3.2 1.3 0.24.6 3.1 1.5 0.25 3.6 1.4 0.25.4 3.9 1.7 0.4[详细]
-
Python中的探索性数据分析(功能式)
所属栏目:[Python] 日期:2020-12-17 热度:180
这里有一些技巧来处理日志文件提[详细]
-
Python决策树分类算法学习
所属栏目:[Python] 日期:2020-12-17 热度:150
从这一章开始进入正式的算法学习。 首先我们学习经典而有效的分类算法:决策树分类算法。 1、决策树算法 决策树用树形结构对样本的属性进行分类,是最直观的分类算法,而且也可以用于回归。不过对于一些特殊的逻辑分类会有困难。典型的如异或(XOR)逻辑,决[详细]
-
Python反射用法实例简析
所属栏目:[Python] 日期:2020-12-17 热度:98
本篇章节讲解Python反射用法。供大家参考研究具体如下: class Person: def __init__(self): self.name = "zjgtan" def getName(self): return self.name 反射的简单含义: 通过类名获得类的实例对象 通过方法名得到方法,实现调用 反射方法一: f[详细]
-
Python数据拟合与广义线性回归算法学习
所属栏目:[Python] 日期:2020-12-17 热度:88
机器学习中的预测问题通常分为2类:回归与分类。 简单的说回归就是预测数值,而分类是给数据打上标签归类。 本文讲述如何用Python进行基本的数据拟合,以及如何对拟合结果的误差进行分析。 本例中使用一个2次函数加上随机的扰动来生成500个点,然后尝试用1、[详细]
-
python 动态加载的实现方法
所属栏目:[Python] 日期:2020-12-17 热度:72
脚本语言都有一个优点,就是动态加载。lua语言有这个优点,python也有这个特性。说简单点就是,如果开发者发现自己的代码有bug,那么他可以在不关闭原来代码的基础之上,动态替换模块。替换方法一般用reload来完成。 1、reload的基本原理 reload主要做了两个[详细]
-
Python KNN分类算法学习
所属栏目:[Python] 日期:2020-12-17 热度:88
本文实例为大家分享了Python KNN分类算法的具体代码,供大家参考,具体内容如下 1、KNN分类算法 KNN分类算法(K-Nearest-Neighbors Classification),又叫K近邻算法,是一个概念极其简单,而分类效果又很优秀的分类算法。 他的核心思想就是,要确定测试样本[详细]
-
NetworkX之Prim算法(实例讲解)
所属栏目:[Python] 日期:2020-12-17 热度:134
引言 Prim算法与Dijkstra的最短路径算法类似,它采用贪心策略。算法开始先把图中权值最小的边添加到树T中,然后不断把权值最小的边E(E的一个端点在T中,另一个在G-T中)。当没有符合条件的E时算法结束,此时T就是G的一个最小生成树。 NetworkX是一款Python[详细]
-
python+selenium实现登录账户后自动点击的示例
所属栏目:[Python] 日期:2020-12-17 热度:73
公司在codereview的时候限制了看代码的时间,实际上不少代码属于框架自动生成,并不需要花费太多时间看,为了达标,需要刷点时间(鼠标点击网页固定区域)。我想到可以利用自动化测试的手段完成这种无效的体力劳动。 首先,明确一下需求: 自动打开网页 登陆[详细]
-
Python2.7下安装Scrapy框架步骤教程
所属栏目:[Python] 日期:2020-12-17 热度:64
由于毕业设计的要求,需要在网站上抓取大量的数据,那么使用Scrapy框架可以让这一过程变得简单不少,毕竟Scrapy是一个为了爬去网站数据、提取结构性数据而编写的应用框架。于是,便开始了我的安装Scrapy框架之旅。可以说这个过程并不是很愉快,各种错误各种[详细]
-
Python机器学习之决策树算法
所属栏目:[Python] 日期:2020-12-17 热度:125
一、决策树原理 决策树是用样本的属性作为结点,用属性的取值作为分支的树结构。 决策树的根结点是所有样本中信息量最大的属性。树的中间结点是该结点为根的子树所包含的样本子集中信息量最大的属性。决策树的叶结点是样本的类别值。决策树是一种知识表示形[详细]
-
利用python将xml文件解析成html文件的实现方法
所属栏目:[Python] 日期:2020-12-17 热度:81
功能就是题目所述,我的python2.7,装在windows环境,我使用的开发工具是wingide 6.0 1、首先是我设计的简单的一个xml文件,也就是用来解析的源文件 下面是这个文件website.xml内容: websitepage name="index" title="fuckyou"h1welcome to/h1pthis is a mom[详细]
