如何在Pandas.read_csv中使用方括号作为引号字符
发布时间:2020-12-16 22:53:05 所属栏目:Python 来源:网络整理
导读:假设我有一个看起来像这样的文本文件: Item,Date,Time,Location1,01/01/2016,13:41,[45.2344:-78.25453]2,01/03/2016,19:11,[43.3423:-79.23423,41.2342:-81242]3,01/10/2016,01:27,[51.2344:-86.24432] 我希望能够做的是用pandas.read_csv读取,但第二行将
假设我有一个看起来像这样的文本文件:
我希望能够做的是用pandas.read_csv读取,但第二行将抛出错误.这是我目前使用的代码:
我试图将quotechar设置为“[”,但是这显然只是占用了行,直到下一个打开括号并添加一个右括号会导致“找到长度为2的字符串”错误.任何见解将不胜感激.谢谢! 更新 提供了三种主要解决方案:1)为数据框提供大量名称,以允许读入所有数据,然后对数据进行后处理,2)在方括号中查找值并在其周围加上引号,或者3)用分号替换前n个逗号. 总的来说,我认为选项3通常不是一个可行的解决方案(虽然对我的数据来说很好),因为a)如果我在一个包含逗号的列中引用了值,b)如果我的方括号列是不是最后一栏?这留下了解决方案1和2.我认为解决方案2更具可读性,但解决方案1更有效,仅运行1.38秒,而解决方案2则运行3.02秒.测试在包含18列和超过208,000行的文本文件上运行. 最佳答案
我想你可以在每行文件中替换前3个出现的;然后使用参数sep =“;”在
read_csv :
或者可以尝试这种复杂的方法,因为主要问题是,分隔符,列表中的值与其他列值的分隔符相同. 所以你需要后期处理:
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐
- 详解python中xlrd包的安装与处理Excel表格
- 使用DRAKON和python的try:except:exception
- 简单介绍利用TK在Python下进行GUI编程的教程
- 利用Python破解斗地主残局详解
- python – 为什么三元运算符比.ts更快?
- Python 多线程,threading模块,创建子线程的两种
- python – Matplotlib ColorbarBase:删除颜色分
- python使用urllib模块和pyquery实现阿里巴巴排名
- 使用Django Crispy Forms渲染单独的MultiWidget字
- django – 我需要一个ModelMultipleChoiceField的
热点阅读