【发布时间】:2020-01-03 04:52:25
【问题描述】:
我有两个 DataFrame,df1 和 df2,它们共享一个索引。我想根据 df2 中的值分配 df1 中的值。
标准的 pandas 代码如下所示:
df1['column1'][df2['column2']==i] = j
当在所有输入上运行时,这会正确填充 df1。
但是,dask DataFrames 上的相同语法会返回错误:
TypeError: 'Series' 对象不支持项目分配
dd.where() 和 dd.mask() 似乎不起作用,因为它们也返回原始值。
是否有与上述熊猫代码等效的dask?
【问题讨论】:
-
您介意提供mcve吗?特别是输入和预期输出。