【发布时间】:2012-12-30 08:23:28
【问题描述】:
有时您必须对一个或多个大型Numpy 数组执行许多中间操作。这会很快导致MemoryErrors。到目前为止,在我的研究中,我发现 Pickling(Pickle、CPickle、Pytables 等)和gc.collect() 是缓解这种情况的方法。我想知道有经验的程序员在处理大量数据时是否还有其他技术(当然,除了删除策略/代码中的冗余)。
另外,如果有一点我可以肯定,那就是没有什么是免费的。使用其中一些技术,有哪些权衡(即速度、鲁棒性等)?
【问题讨论】:
-
这能回答你的问题吗? Very large matrices using Python and NumPy
标签: python arrays optimization memory-management numpy