提高python os.walk正则表达式算法的效率

发布时间：2020-12-20 13:36:00 所属栏目：Python 来源：网络整理

导读：我正在使用os.walk从特定文件夹中选择与正则表达式匹配的文件. for dirpath,dirs,files in os.walk(str(basedir)): files[:] = [f for f in files if re.match(regex,os.path.join(dirpath,f))] print dirpath,files 但这必须处理basedir下的所有文件和文件

我正在使用os.walk从特定文件夹中选择与正则表达式匹配的文件.

for dirpath,dirs,files in os.walk(str(basedir)):
    files[:] = [f for f in files if re.match(regex,os.path.join(dirpath,f))]
    print dirpath,files

但这必须处理basedir下的所有文件和文件夹,这非常耗时.我正在寻找一种方法来使用与文件相同的正则表达式来过滤掉每个步骤中不需要的目录.或者只匹配部分正则表达式的方法……

例如,在像这样的结构中

/data/2013/07/19/file.dat

使用例如以下正则表达式

/data/(?P<year>2013)/(?P<month>07)/(?P<day>19)/(?P<filename>.*.dat)

查找所有.dat文件,而无需查看例如/数据/ 2012

解决方法

例如,如果您只想处理/ data / 2013/07/19中的文件,只需从目录top / data / 2013/07/19启动os.walk().这类似于Tommi Komulainen的建议,但您无需修改??循环代码.

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!