【发布时间】:2019-05-11 14:37:55
【问题描述】:
我有一个名为“mj_flt”的大熊猫数据框,我想根据数据框中的某些列做一些事情,并将结果附加到一个空列表中。由于Dataframe太大,我需要使用for循环来批量处理Dataframe。我试图并行化的代码如下:
start = np.array(np.arange(0,6900000,300000))
end = np.array(np.arange(300000,7200000,300000))
tim = []
for (i,j) in zip(start,end):
for index, row in mj_flt[i:j].iterrows():
## do some stuff with row['a'],row['b'],row['c'],row['d']
## get a result based on the operation
tim.append(result)
如何使用 Multiprocessing 模块和 Pool 函数使嵌套的 for 循环并行化?
非常感谢!
【问题讨论】:
标签: python for-loop parallel-processing multiprocessing python-multiprocessing