加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 以4个为一组从HUGE文本文件中读取行

发布时间:2020-12-20 12:19:42 所属栏目:Python 来源:网络整理
导读:几天后我遇到了 python问题.我是一名没有基本编程技能的生物信息学,我正在使用我必须处理的大文本文件(约25gb). 我必须逐行读取txt文件,每组4行,这意味着必须读取和处理前4行,然后我必须读取第2组4行,依此类推. 显然我不能使用readlines()运算符,因为它会使
几天后我遇到了 python问题.我是一名没有基本编程技能的生物信息学,我正在使用我必须处理的大文本文件(约25gb).

我必须逐行读取txt文件,每组4行,这意味着必须读取和处理前4行,然后我必须读取第2组4行,依此类推.

显然我不能使用readlines()运算符,因为它会使我的内存过载,我必须使用4行中的每一行进行一些字符串识别.

我考虑过使用带有范围运算符的for循环:

openfile = open(path,’r’)

对于范围内的elem(0,len(openfile),4):

line1 = readline()
line2 = readline()
line3 = readline()
line4 = readline()
(process lines...)

不幸的是,这是不可能的,因为处于“读取”模式的文件不能被迭代并被视为列表或字典.

任何人都可以帮忙正确地循环吗?

提前致谢

解决方法

有一种方法可以在Python here中懒惰地读取大文件.您可以使用该方法并一次处理四行.请注意,不必执行四次读取操作,然后重复执行处理,然后再次执行四次读取操作.您可以从文件中读取几百或几千行的块,然后一次处理四行.完成这些行后,您可以继续阅读文件的内容.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读