【发布时间】:2020-04-05 16:49:38
【问题描述】:
我正在尝试在 pandas 中执行尺寸为 3383*192 和 5587*1487 的两个 pandas 文件的交叉连接并收到:内存错误。 谁能指导我如何在 python 的 .csv 文件中执行交叉连接并获得完整的输出(在 python 中的批处理或使用整个数据集)
【问题讨论】:
-
试用these 方法。
-
请提供一些代码的最小示例
-
也许这会有所帮助。 stackoverflow.com/questions/37756991/…您正在尝试加入两个非常大的数据框。 Python 可能无法处理它。
-
尝试内连接,在两个 dfs 中使用恒定的标量值。您可以尝试 dask 以防问题仍然存在