加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

聚合新闻头条

发布时间:2020-12-14 05:03:07 所属栏目:百科 来源:网络整理
导读:确定新闻来源 有头条新闻的提取头条新闻 from requests_html import HTMLSession #导入爬虫所需的模块 def get_news(): ans_news_titles = [] #定义一个空列表 session = HTMLSession() #创建爬虫模块对象 r =session.get( ‘ https://news.baidu.com/ ‘ )

确定新闻来源

有头条新闻的提取头条新闻

from requests_html import HTMLSession        #导入爬虫所需的模块

def get_news():
    ans_news_titles=[]    #定义一个空列表
    session=HTMLSession()  #创建爬虫模块对象
    r=session.get(https://news.baidu.com/)    #获取页面
    title1_baidu=r.html.find(#pane-news > div > ul > li.hdline0 > strong > a,first=True)  #查找css选择器对应的内容,
    ans_news_titles.append(title1_baidu)
    titles_baidu=r.html.find(#pane-news > ul:nth-child(n) > li.bold-item > a)
    ans_news_titles+=titles_baidu
    for title in ans_news_titles:
        print(title.text)

if __name__ == __main__:
    get_news()

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读