【发布时间】:2018-09-16 09:31:12
【问题描述】:
我正在尝试将 dictionary 中的 remap 数据转换为数据框中的相应值,并且我成功了。
当我使用几千条数据时这很好,但如果我尝试使用几百万条数据,它会变得非常缓慢,有时甚至永远不会结束。
这是我正在使用的代码,适用于更少的数据:
def remap(data,dict_labels):
for field,values in dict_labels.items():
data.replace({field:values},inplace=True)
print("DONE")
return data
dataframe1 = remap(df,dataDict)
是否有任何有效的方法可以将其他东西用于同一任务,以便更快地处理大数据?
【问题讨论】:
-
为什么需要for循环?你做的不就是
data.replace(dict_labels, inplace=True)吗?
标签: python performance pandas dictionary dataframe