加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

[bigdata-56] py3+selenium 抓取学信网 最简demo

发布时间:2020-12-14 03:16:55 所属栏目:大数据 来源:网络整理
导读:各种情况不考虑,只演示核心功能。 #!/usr/bin/env python3# !-*- coding:utf-8 -*-"""演示如何抓取学信网"""import timefrom selenium import webdriverdef get_sub_regions(browser,url): #登录页面 browser.get(url) #输入用户名 elem = browser.find_ele

各种情况不考虑,只演示核心功能。


#!/usr/bin/env python3
# !-*- coding:utf-8 -*-

"""
演示如何抓取学信网
"""

import time

from selenium import webdriver

def get_sub_regions(browser,url):
    #登录页面
    browser.get(url)
    #输入用户名
    elem = browser.find_element_by_id('username')
    elem.clear()
    elem.send_keys('187xxxxxxxx')
    elem = browser.find_element_by_id('password')
    #输入密码
    elem.clear()
    elem.send_keys('99xxxxx')
    #点击登录
    elem = browser.find_element_by_xpath('//input[@class="btn_login btn_login_my"]')
    elem.click()
    # 点击进入查看页面
    time.sleep(5)
    elem = browser.find_element_by_xpath('//a[@class="login-btn"]')
    elem.click()
    # 高等教育信息
    time.sleep(5)
    elem = browser.find_element_by_xpath('//a[@href="gdjy/xj/show.action"]')
    elem.click()
    # 样例查询
    time.sleep(5)
    # elem = browser.find_element_by_xpath('//div[@class="main"]')
    elems = browser.find_elements_by_xpath('//div[@class="m-left xj-left main-block border-shadow"]')
    for i in elems:
        print(i.text)

def main():
    #启动浏览器
    browser = webdriver.Firefox()
    #登录学信网
    sh_business_regions = get_sub_regions(browser,'https://account.chsi.com.cn/passport/login?service=https%3A%2F%2Fmy.chsi.com.cn%2Farchive%2Fj_spring_cas_security_check')

if __name__ == '__main__':
    main()

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读