【发布时间】:2016-04-17 01:19:03
【问题描述】:
我正在尝试读取包含数十万行的大型文本文件,以使其运行更快带有熊猫文件的循环。 Lmk 如果有一个程序这样做是合乎逻辑的,以试图缩短运行时间。谢谢..
df1 = pd.read_csv('FILENAME1',sep=',',error_bad_lines=False)
df2 = pd.read_csv('FILENAME2',sep=',',error_bad_lines=False)
for index, row in df1.iterrows():
for index2, row2 in df2.iterrows():
if index[1]==row2[2] and index[0]==row2[1]:
print "this info matches"
【问题讨论】:
-
你想达到什么目的?您能否还以文本形式和所需的输出/结果集发布每个数据集的示例数据集(5-7 行)?
-
使用数据框的目的是不必循环。看看这个链接。比较相似的数据框。 stackoverflow.com/questions/20225110/…
标签: python for-loop pandas cpu-speed