【发布时间】:2018-08-11 05:17:26
【问题描述】:
我想知道如何优化这种转换,我需要计算 1.25 亿行的星期几,我有一台具有 4 GB RAM 的计算机,我只是尝试这样做:
df_train['date'].dt.dayofweek.compute()
而我的装有 Ubuntu 16.04 和 Intel Core 2 Duo E7200 @ 2.5 GHz 的 PC 卡住了,我需要重新启动它
有什么办法可以优化吗?
【问题讨论】:
-
如果您的计算机由于内存问题而死机,您是否考虑过简单地将一周中的每一天逐行输出到文件(例如 csv 或 hdf5)?这应该有最小的内存开销。