【发布时间】:2016-09-16 17:40:47
【问题描述】:
我正在尝试从位于一个文件夹中的每个 zip 文件中提取一个文本文件。然后我想将这些文本文件合并到一个数据框中。
该文件夹有多个 Zip 文件:
pf_0915.zip
pf_0914.zip
pf_0913.zip
.....
这些 zip 文件中包含多个文本文件。我只对名为 abc.txt 的文件感兴趣。这是一个没有标题的固定宽度格式文件。我已经使用 read_fwd 为这个文件设置了读取。由于所有提取的文本文件都具有相同的名称,因此最好根据存档名称重命名它们。即 pf_0915.zip 中的 abc.txt 可以称为 abc_0915.txt。全部读取后,应将它们组合成一个名为 abcCombined.txt 的大文件。
或者在读取每个新的 abc.txt 文件时,我们可以将其添加到 abcCombined.txt。
我尝试了各种版本的 unzip() 和 unz(),但没有取得多大成功。这是在没有遍历所有 zip 文件的情况下完成的。最后,这个目录包含许多 zip 文件,有没有办法通过像 grep 这样的模式匹配来读取其中的一些文件。例如,我有兴趣只阅读 9 月的文件,那些 .._09...txt。
任何提示将不胜感激。
【问题讨论】:
-
你能分享一个示例代码来看看你尝试了什么吗?
标签: r zip text-files extract