加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 为什么我的glob.glob循环不遍历文件夹中的所有文本文

发布时间:2020-12-20 13:11:07 所属栏目:Python 来源:网络整理
导读:我试图从包含 python 3的文本文档的文件夹中读取.具体来说,这是对LingSpam垃圾邮件数据集的修改.我期待我写的代码返回所有1893个文本文档名称,但是,代码返回前420个文件名.我不明白为什么它没有停止文件名的总数.有任何想法吗? if not os.path.exists('trai
我试图从包含 python 3的文本文档的文件夹中读取.具体来说,这是对LingSpam垃圾邮件数据集的修改.我期待我写的代码返回所有1893个文本文档名称,但是,代码返回前420个文件名.我不明白为什么它没有停止文件名的总数.有任何想法吗?

if not os.path.exists('train'):  # download data
  from urllib.request import urlretrieve
  import tarfile
  urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz','lingspam.tgz')
  tar = tarfile.open('lingspam.tgz')
  tar.extractall()
  tar.close()
abc = []
for f in glob.glob("train/*.txt"):
  print(f)
  abc.append(f)
print(len(abc))

我试过更改glob参数但仍然没有成功.

编辑:显然我的代码适用于除我之外的所有人.这是我的output

解决方法

成功!问题是

if not os.path.exists('train'):  # download data

为了检查我的输出,我实际上已经将文件下载到我的计算机上,并且由于该行检查了该文件夹是否存在,并且它确实存在,因此导致了问题.我删除了我的机器上的文件,现在它可以正常工作,但我怀疑是在运行

from urllib.request import urlretrieve
  import tarfile
  urlretrieve('http://cs.iit.edu/~culotta/cs429/lingspam.tgz','lingspam.tgz')
  tar = tarfile.open('lingspam.tgz')
  tar.extractall()
  tar.close()

没有if语句就会有相同的结果.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读