-
Python使用PDFMiner解析PDF代码实例
所属栏目:[Python] 日期:2020-12-17 热度:172
近期在做爬虫时有时会遇到网站只提供pdf的情况,这样就不能使用scrapy直接抓取页面内容了,只能通过解析PDF的方式处理,目前的解决方案大致只有pyPDF和PDFMiner。因为据说PDFMiner更适合文本的解析,而我需要解析的正是文本,因此最后选择使用PDFMiner(这也[详细]
-
Python+Selenium自动化实现分页(pagination)处理
所属栏目:[Python] 日期:2020-12-17 热度:170
场景 对分页来说,我们最感兴趣的是下面几个信息 总共有多少页 当前是第几页 是否可以上一页和下一页 代码 下面代码演示如何获取分页总数及当前页数、跳转到指定页数 #coding:utf-8from selenium import webdriverimport timedriver = webdriver.Chrome()dri[详细]
-
python递归查询菜单并转换成json实例
所属栏目:[Python] 日期:2020-12-17 热度:103
最近需要用python写一个菜单,折腾了两三天才搞定,现在记录在此,需要的朋友可以借鉴一下。 备注:文章引用非可执行完整代码,仅仅摘录了关键部分的代码 环境 数据库:mysql python:3.6 表结构 CREATE TABLE `tb_menu` ( `id` varchar(32) NOT NULL COMMEN[详细]
-
windows系统下Python环境搭建教程
所属栏目:[Python] 日期:2020-12-17 热度:76
windows系统下Python环境的搭建 step1:下载Python程序 https://www.python.org/downloads/release/python-351/ 选择第一个下载下来(随随便下载哪个) step2:安装及配置环境 点击程序默认安装 step3:开发配置环境 电脑-系统-高级系统设置-环境变量-系统变[详细]
-
一个基于flask的web应用诞生 用户注册功能开发(5)
所属栏目:[Python] 日期:2020-12-17 热度:103
下面把角色分为两种,普通用户和管理员用户,至少对于普通用户来说,直接修改DB是不可取的,要有用户注册的功能,下面就开始进行用户注册的开发。 用户表 首先要想好用户注册的时候需要提供什么信息:用户名、密码、昵称、邮箱、生日、性别、自我介绍,下面[详细]
-
python 生成器生成杨辉三角的方法(必看)
所属栏目:[Python] 日期:2020-12-17 热度:112
用Python写趣味程序感觉诺模2幌吕 #生成器生成展示杨辉三角#原理是在一个2维数组里展示杨辉三角,空的地方用0,输出时,转化为' 'def yang(line): n,leng=0,2*line - 1 f_list = list(range(leng+2)) #预先分配,insert初始胡会拖慢速度,最底下一行,左右[详细]
-
windows上安装Anaconda和python的教程详解
所属栏目:[Python] 日期:2020-12-17 热度:195
一提到数字图像处理编程,可能大多数人就会想到matlab,但matlab也有自身的缺点: 1、不开源,价格贵 2、软件容量大。一般3G以上,高版本甚至达5G以上。 3、只能做研究,不易转化成软件。 因此,我们这里使用Python这个脚本语言来进行数字图像处理。 要使用P[详细]
-
Python实现将一个大文件按段落分隔为多个小文件的简单操作方法
所属栏目:[Python] 日期:2020-12-17 热度:125
本篇章节讲解Python实现将一个大文件按段落分隔为多个小文件的简单操作方法。供大家参考研究具体如下: 今天帮同学处理一点语料。语料文件有点大,并且是以连续两个换行符作为段落标志,他想把它按段落分隔成多个小文件,即每3个段落组成一个新文[详细]
-
深入解答关于Python的11道基本面试题
所属栏目:[Python] 日期:2020-12-17 热度:136
前言 本文给大家深入的解答了关于Python的11道基本面试题,通过这些面试题大家能对python进一步的了解和学习,下面话不多说,来看看详细的介绍吧。 一、单引号,双引号,三引号的区别 分别阐述3种引号用的场景和区别 1),单引号和双引号主要用来表示字符串 比[详细]
-
Linux文件管理使用详解
所属栏目:[Python] 日期:2020-12-17 热度:56
对于计算机来说,所谓的数据就是0和1的序列。这样的一个序列可以存储在内存中,但内存中的数据会随着关机而消失。为了将数据长久保存,我们把数据存储在光盘或者硬盘中。根据我们的需要,我们通常会将数据分开保存到文件这样一个个的小单位中(所谓的小,是相[详细]
-
详解Python中最难理解的点-装饰器
所属栏目:[Python] 日期:2020-12-17 热度:98
本文将带领大家由浅入深的去窥探一下,这个装饰器到底是何方神圣,看完本篇,装饰器就再也不是难点了. 一、什么是装饰器 网上有人是这么评价装饰器的,我觉得写的很有趣,比喻的很形象 每个人都有的内裤主要是用来遮羞,但是到了冬天它没法为我们防风御寒,[详细]
-
Python 中开发pattern的string模板(template) 实例详解
所属栏目:[Python] 日期:2020-12-17 热度:84
定制pattern的string模板(template) 详解 string.Template的pattern 是一个正则表达式,可以通过 覆盖pattern属性 ,定义新的正则表达式. 如: 使用新的定界符"{{",把{{var}}作为变量语法. 代码: # -*- coding: utf-8 -*- ''''' Created on 2014.6.5 @author: A[详细]
-
Python 多线程实例详解
所属栏目:[Python] 日期:2020-12-17 热度:61
Python 多线程实例详解 多线程通常是新开一个后台线程去处理比较耗时的操作,Python做后台线程处理也是很简单的,今天从官方文档中找到了一个Demo. 实例代码: import threading,zipfile class AsyncZip(threading.Thread): def __init__(self,infile,outfil[详细]
-
Python爬取网易云音乐热门评论
所属栏目:[Python] 日期:2020-12-17 热度:172
最近在研究文本挖掘相关的内容,所谓巧妇难为无米之炊,要想进行文本分析,首先得到有文本吧。获取文本的方式有很多,比如从网上下载现成的文本文档,或者通过第三方提供的API进行获取数据。但是有的时候我们想要的数据并不能直接获取,因为并不提供直接的下[详细]
-
Python中的命令行参数解析工具之docopt详解
所属栏目:[Python] 日期:2020-12-17 热度:185
前言 docopt 是一个开源的库,代码地址:https://github.com/docopt/docopt。它在 README 中就已经做了详细的介绍,并且还附带了很多例子可供学习,这篇文章也是翻译一下 README 中内容…… docopt 最大的特点在于不用考虑如何解析命令行参数,而是当你把心[详细]
-
教大家玩转Python字符串处理的七种技巧
所属栏目:[Python] 日期:2020-12-17 热度:129
前言 日常使用python经常要对文本进行处理,无论是爬虫的数据解析,还是大数据的文本清洗,还是普通文件的处理,都是要用到字符串. Python对字符串的处理内置了很多高效的函数,非常方便功能很强大.下面是我总结的常用的7招,有了这几招就能轻松应对字符串处[详细]
-
python获取当前运行函数名称的方法实例代码
所属栏目:[Python] 日期:2020-12-17 热度:195
python获取当前运行函数名称的方法实例代码 摘要: c/c++中获取函数所在源码名,函数名和行号的方法很简单 __FILE__,__FUNCTION__和__LINE__ python没有这种语法,但也可以通过某种方法得到,这里给出例子,使用异常信息得到【可能会损失性能】 直接贴代码[可[详细]
-
Python利用Beautiful Soup模块创建对象详解
所属栏目:[Python] 日期:2020-12-17 热度:117
安装 通过 pip 安装 Beautiful Soup 模块: pip install beautifulsoup4 。 还可以使用 PyCharm IDE 来写代码,在 PyCharm 中的 Preferences 中找到 Project ,在里面搜索 Beautiful Soup 模块,进行安装即可。 创建 BeautifulSoup 对象 Beautiful Soup 模块[详细]
-
详解Python多线程Selenium跨浏览器测试
所属栏目:[Python] 日期:2020-12-17 热度:141
前言 在web测试中,不可避免的一个测试就是浏览器兼容性测试,在没有自动化测试前,我们总是苦逼的在一台或多台机器上安装N种浏览器,然后手工在不同的浏览器上验证主业务流程和关键功能模块功能,以检测不同浏览器或不同版本浏览器上,我们的web应用是否可[详细]
-
python爬取w3shcool的JQuery课程并且保存到本地
所属栏目:[Python] 日期:2020-12-17 热度:115
最近在忙于找工作,闲暇之余,也找点爬虫项目练练手,写写代码,知道自己是个菜鸟,但是要多加练习,书山有路勤为径。各位爷有测试坑可以给我介绍个啊,自动化,功能,接口都可以做。 首先呢,我们明确需求,很多同学呢,有事没事就想看看一些技术,比如我想[详细]
-
详解Python之数据序列化(json、pickle、shelve)
所属栏目:[Python] 日期:2020-12-17 热度:66
一、前言 1. 现实需求 每种编程语言都有各自的数据类型,其中面向对象的编程语言还允许开发者自定义数据类型(如:自定义类),Python也是一样。很多时候我们会有这样的需求: 把内存中的各种数据类型的数据通过网络传送给其它机器或客户端; 把内存中的各种[详细]
-
Django实现自定义404,500页面教程
所属栏目:[Python] 日期:2020-12-17 热度:67
1.创建一个项目 django-admin.py startproject HelloWorld 2.进入HelloWorld项目,在manage.py的同一级目录,创建templates目录,并在templates目录下新建404.html,500.html两个文件。 3.修改settings.py (1.)DEBUG修改为False,(2.)ALLOWED_HOSTS添加指[详细]
-
Python可变参数用法实例分析
所属栏目:[Python] 日期:2020-12-17 热度:148
本篇章节讲解Python可变参数用法。供大家参考研究具体如下: #!/usr/bin/env python# -*- coding: utf-8 -*-import mathdef calc(*numbers): sum=0 for n in numbers: sum+=n**2 return sumprint(calc(1,2,3))print(calc(1,3,5,7))print(calc())[详细]
-
Windows下安装python2和python3多版本教程
所属栏目:[Python] 日期:2020-12-17 热度:118
现在大家常用的桌面操作系统有:Windows、Mac OS、ubuntu,其中Mac OS 和 ubuntu上都会自带python。这里我们只介绍下Windows(我用的Win10)环境下的python2.x 和 python3.x 的安装,以及python2.x 与 python3.x 共存时的配置问题。 一、python下载: 下载地[详细]
-
Python 文件处理注意事项总结
所属栏目:[Python] 日期:2020-12-17 热度:186
Python 文件处理注意事项总结 文件处理在编程中是常见的操作,文件的打开,关闭,重命名,删除,追加,复制,随机读写非常容易理解和使用。需要注意的是文件的安全关闭,采用with语句轻松便捷: with open(pathname,”r”) as myfile: do_some_with(myfile)[详细]
