Python净化百度搜索结果!真正的做到无广告环境!
利用Python净化百度搜索结果。。。 既然是净化。。。 广告什么的当然要通通剔除啦。。。 至于为什么要做这个。。。 大概是因为昨天留言中有人提到了这个。。。 所以。。。 just have a try! Python很容易学!小编有弄一个交流,互问互答,资源共享的交流学习基地,如果你也是Python的学习者或者大牛都欢迎你来!?:548+377+875!一起 学习共同进步! 主要思路 利用Python处理百度搜索关键字后返回的页面,提取其中的有效信息。 有效信息包括: 剔除广告等无用链接后的有用链接以及这些有用链接的标题信息。 后续处理: 毕竟一千个读者就有一千个哈姆雷特,所以我只举一个简单的利用这些有效信息的例子。 至于是什么例子。。。 继续看下去就知道了呗~~~ 开发工具 Python版本:3.5.4 相关模块: requests模块、bs4模块、win_unicode_console模块、PyQt5模块以及一些Python自带的模块。 环境搭建 安装Python并添加到环境变量,pip安装需要的相关模块即可。 使用方式 (1)直接运行 功能: 在cmd窗口运行BaiduSearch_Spider.py文件后,根据提示输入相关信息后将得到的有效信息保存到results.txt文件中。 若需其他功能请自行修改源代码。 运行示例如下图所示: 结果: (2)作为模块导入 使用示例如下图所示: 运行以及结果图: 说明与简单实例 返回的数据格式为: 简单实例: 功能: (1)在cmd窗口中运行并展示获得的有效信息; (2)根据有效信息选择想要了解的链接后将该链接网站在PyQt制作的简易Demo中显示。 结果图: 细心的小伙伴可能会发现: 这里不支持播放这种视频。。。因为我没配置。。。 官网有配置教程。。。全英文实在懒得看。。。 反正今天的任务已经完成了。。。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |