【发布时间】:2014-09-02 02:18:19
【问题描述】:
我有一个包含十列和 100000 行的简单 HDF5 文件(由 PyTables 创建)。对于每个值,我必须应用一个简单的线性方程,每列具有不同的参数,并将内容写入 CSV。
我幼稚的方法是遍历表格:
for row in table.iterrows():
print "%f,%f,..." % (row['a'] * 1.0 + 2.0, row['b'] * 3.0 + 4.0, ...)
但我想知道,选择列并以这种方式计算它们然后迭代结果数组是否会更有效:
a = numpy.add(numpy.multiply(table.cols.a, 1.0), 2.0)
b = numpy.add(numpy.multiply(table.cols.b, 3.0), 4.0)
但这似乎更慢。
最好的方法是什么?
【问题讨论】:
标签: python numpy hdf5 pytables