【问题标题】:Python: How do I output all the text contents of a directory containing .txt files as a list?Python:如何将包含 .txt 文件的目录的所有文本内容输出为列表?
【发布时间】:2020-05-19 15:05:58
【问题描述】:

我有一个目录文件,其中包含三千个 .txt 文件,其中包含抓取的文本段落。

我正在尝试在 python 中输出一个列表,其中每个列表行包含一个 .txt 文件的内容

我对 python 还很陌生,到目前为止我所能做到的只是;

import glob

mylist = [f for f in glob.glob("/Users/Downloads/Datasets/transcripts/*.txt")]

但是,我从中得到的只是 3,000 个列表,每行包含 .txt 文件的标题,而不是内容

想知道是否有人可以帮忙,谢谢:)

【问题讨论】:

  • @MillyCodsworth:给出的答案是否解决了您的问题?然后您应该通过单击它旁边的复选/勾号来接受它。 (我刚才看到你提出了两个请求,但没有接受任何答案,所以我想我会告诉你。我正要回答你的另一个答案,顺便说一下在SQL中拆分字符串,你之前删除了不幸的是,我可以发布我的答案。)

标签: python list nlp glob


【解决方案1】:

glob 方法返回文件名称(或路径)的列表。您需要遍历该列表,打开文件并将内容附加到您的列表中:

texts = []

for text_file in glob.glob("/Users/Downloads/Datasets/transcripts/*.txt"):
    with open(text_file, 'r') as f:
        t = f.read()
        texts.append(t)

【讨论】:

    猜你喜欢
    • 2011-08-05
    • 1970-01-01
    • 1970-01-01
    • 2012-02-27
    • 2015-09-29
    • 1970-01-01
    • 2018-01-02
    • 1970-01-01
    • 2014-01-21
    相关资源
    最近更新 更多