【发布时间】:2014-06-11 11:30:02
【问题描述】:
有什么好的 Python 库可以处理非常大的矩阵(例如数百万行/列),包括在矩阵生命周期的任何阶段添加行或列的能力?
我查看了pytables 和h5py,但它们都不支持在创建矩阵后添加或删除行或列。
我能找到的唯一其他东西是thesequestions 中提到的 numpy/scipy 中的稀疏矩阵功能。然而,添加/删除行和列的能力似乎是可能的,但官方不支持并且有点 hacky,所以我担心使用真实数据集的性能会很糟糕。此外,它包括几种不同的稀疏矩阵实现,所以我很困惑哪一个最好(例如 lil_matrix vs csc_matrix vs csr_matrix)。
【问题讨论】:
标签: python numpy matrix scipy large-data