【发布时间】:2015-07-27 17:14:00
【问题描述】:
我有多个包含文本数据流的文本文件。有些标题会根据计数分解数据。问题是我感兴趣的数据块的标题可能在另一个文件中。好像是这样的……
file1.txt
=======Boot Count 1============
(random text strings)
...
...
...
=======Boot Count 2============
...
file2.txt
...
...
...
=======Boot Count 3============
...
...
=======Boot Count 4============
...
file3.txt
...
...
我需要找到一些位于最新启动计数中的信息。所以我需要
- 将文本文件连接在一起
- 向后搜索直到看到引导计数标头
- 去掉所有多余的东西
- 然后只在最后一部分搜索特定字符串。
我可以处理#4。关于 1-3 有什么想法吗?
【问题讨论】:
-
所以基本上你想要最高启动计数部分?
-
正确。之后我可以使用正则表达式来查找我要查找的内容,但首先我需要正确的部分来搜索
-
为什么不逐个搜索每个文件以查找启动计数,然后只保存最新的?这将消除 (1) 并使 (2) 更容易。
-
因为不能保证文件中包含启动计数。标题可以在一个文件中,内容可以滚动到另一个文件中
-
@njfrazie,你为什么需要连接文件,当然你想要的只是最新的启动计数并从那里向下搜索?
标签: python