【发布时间】:2019-06-17 21:48:14
【问题描述】:
我有大约 100 个包含 1-2 段临床笔记的文本文件。每个文件相应地命名为 doc_1.txt 到 doc_179.txt。我想将每个文件中的文本保存到一个 .csv 文件中,该文件有 2 列带标题(id、文本)。 id 列是每个文件的名称。
例如doc_1是记录文件名,将成为id。 doc_1 中的文本将存储在 text column 中。期望的结果如下
| id | text |
|:-----:|:----:|
| doc_1 | abcf |
| doc_2 | efrf |
| doc_3 | gvni |
到目前为止,我只是查看了文本,还没有确定实现我的结果的最佳实用方法。
【问题讨论】:
-
你查看过 Python 3 中的csv library 吗?它允许您将文件的每一行读入 csv,并且您可以指定分隔符。
-
@jhelphenstine 不,我没有尝试过 csv 库。查看类似的代码,我想我必须附加文件名和文本。
标签: python-3.x pandas csv dataframe nlp