【发布时间】:2011-06-24 12:48:35
【问题描述】:
我希望主题足够清楚,我在之前询问的垃圾箱中没有找到任何具体的内容。我已经尝试在 Perl 或 Python 中实现这一点,但我想我可能太努力了。
是否有一个简单的 shell 命令/管道可以根据开始和结束的正则表达式将我的 4mb .txt 文件拆分为单独的 .txt 文件?
我在下面提供了文件的简短示例。因此您可以看到每个“故事”都以短语“X of XXX DOCUMENTS”开头,可用于拆分文件。
我认为这应该很容易,如果 bash 不能做到这一点,我会感到惊讶 - 比 Perl/Py 更快。
这里是:
1 of 999 DOCUMENTS
Copyright 2011 Virginian-Pilot Companies LLC
All Rights Reserved
The Virginian-Pilot(Norfolk, VA.)
...
3 of 999 DOCUMENTS
Copyright 2011 Canwest News Service
All Rights Reserved
Canwest News Service
...
提前感谢您的帮助。
罗斯
【问题讨论】:
-
需要这么多示例文本吗?
-
请编辑并删除您问题中大约 95% 的文字。
标签: regex bash shell unix scripting