【发布时间】:2012-12-31 10:43:07
【问题描述】:
我有两个文件如下图:
文件 1(制表符分隔):
A1 一些信息1 一些信息2 一些信息3 A1 一些信息1 一些信息2 一些信息3 B1 一些信息1 一些信息2 一些信息3 B1 一些信息1 一些信息2 一些信息3文件 2(制表符分隔):
A1 新信息1 新信息2 新信息3 A1 新信息1 新信息2 新信息3 B1 新信息1 新信息2 新信息3 B1 新信息1 新信息2 新信息3我想从文件 1 中一起读取两行(以 A1 和 A1 开头的行)和从文件 2 中读取两行(以 A1 和 A1 开头的行)。为了更清楚,我有两个要求:
1)从同一个文件中读取两行 2)从另一个文件中读取相同的两行。确切地说,我想一起读取四行(两个文件中的 2 行连续的行(每个文件中的 2 行))。
我在网上搜索并获得了一个代码,可以同时读取两行,但只能从一个文件中读取。
使用 open(File1) 作为 file1: 对于 itertools.izip_longest(*[file1]*2) 中的 line1、line2:此外,我还能够从两个文件中的每一个中读取一行:
对于枚举(itertools.izip(f1,f2))中的 i,(line1,line2): 打印第 1 行、第 2 行但我想做这样的事情:
伪代码:
对于 file1 中的 line1、line2 和 file2 中的 line_1 和 line_2: 比较 line1 和 line2 比较 line1 和 line_1 比较 line2 和 line_1 比较 line2 和 line_2我希望解决方案是线性时间的。所有文件都具有相同的行数,并且文件中的连续行的第一列(主 id)相同,另一个文件遵循相同的顺序(参见上面的示例)。
谢谢。
【问题讨论】:
-
为什么
compare line1 with line2而不是compare line1 with line_2就像line2一样?
标签: python