加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

Python追加添加相同的数据

发布时间:2020-12-20 11:08:15 所属栏目:Python 来源:网络整理
导读:我正试图从韩国网站上提取股票价格和市值数据. 这是我的代码: import requestsfrom bs4 import BeautifulSoupresponse = requests.get('http://finance.naver.com/sise/sise_market_sum.nhn?sosok=0page=1')html = response.textsoup = BeautifulSoup(html,
我正试图从韩国网站上提取股票价格和市值数据.

这是我的代码:

import requests
from bs4 import BeautifulSoup

response = requests.get('http://finance.naver.com/sise/sise_market_sum.nhn?sosok=0&page=1')
html = response.text
soup = BeautifulSoup(html,'html.parser')

table = soup.find('table',{ 'class': 'type_2' })
data = []
for tr in table.find_all('tr'):
    tds = list(tr.find_all('td')) 

    for td in tds:
        if td.find('a'):
            company_name = td.find('a').text 
            price_now = tds[2].text
            market_cap = tds[5].text 
            data.append([company_name,price_now,market_cap])    


print(*data,sep = "n")

这就是我得到的结果. (抱歉韩文字符)

[‘????’,‘43,650’,‘100’]

[”,‘100’]

[‘SK????’,‘69,800’,‘5,000’]

[”,000’]

结果中的第二行和第四行不应该存在.我只想要第一行和第三行.第二和第四行来自哪里,如何摆脱它们?

解决方法

亲爱的朋友,我认为问题是你应该检查td.find(‘a’).文本是否有值!

所以我将你的代码改为此,它的工作原理!

import requests
from bs4 import BeautifulSoup

response = requests.get(
    'http://finance.naver.com/sise/sise_market_sum.nhn?sosok=0&page=1')
html = response.text
soup = BeautifulSoup(html,{'class': 'type_2'})
data = []
for tr in table.find_all('tr'):
    tds = list(tr.find_all('td'))

    for td in tds:
        # where magic happends!
        if td.find('a') and td.find('a').text:
            company_name = td.find('a').text
            price_now = tds[2].text
            market_cap = tds[5].text
            data.append([company_name,market_cap])

print(*data,sep="n")

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读