加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

使用Python中的逗号刮取数据

发布时间:2020-12-20 13:08:47 所属栏目:Python 来源:网络整理
导读:我正在使用带有请求和lxml的 Python来搜索表.使用tree.xpath找到表中的数据,并将其添加到写入CSV文件的列表中.不幸的是,其中一个表的列中的行包含逗号,这会改变列表中的值的数量. 例: from lxml import htmlimport requestspage = requests.get('http://url
我正在使用带有请求和lxml的 Python来搜索表.使用tree.xpath找到表中的数据,并将其添加到写入CSV文件的列表中.不幸的是,其中一个表的列中的行包含逗号,这会改变列表中的值的数量.

例:

from lxml import html
import requests

page = requests.get('http://url.com/table')
tree = html.fromstring(page.content)

list1 = tree.xpath('//*[@id=block]/div/tr[*]/td[1]/a/text()')
list2 = tree.xpath('//*[@id=block]/div/tr[*]/td[2]/a/text()')

我刮的表:

Column1 | Column2
A,B,C     X
D,E       Y
F,G,H     Z

电流输出:

print list1
['A','B','C','D','E','F','G','H']

print list2
['X','Y','Z']

首选输出:

print list1
['a b c','d e','f g h']

print list2
['x','y','z']

我找不到合适的解决方案了.是否有一种简单的方法可以从值中删除逗号或在列表中使用不同的分隔符时保留逗号?谢谢您的帮助!

编辑:这是CSV编写器.

csv_out = open('file.csv','wb')
writer = csv.writer(csv_out,dialect = 'excel-tab')
writer.writerows(list,list2,etc)
csv_out.close()

解决方法

您应该使用csv模块来编写文件.您可以选择分隔符(例如|)或使用引号来处理逗号.

如果您还有其他问题,请与我们联系!

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读