【发布时间】:2018-02-25 03:14:23
【问题描述】:
我有一个 16x10 的熊猫数据框,每个单元格中有 1x35000 个数组(或 NaN)。我想对每列的行取元素平均值。
1 2 3 ... 10
1 1x35000 1x35000 1x35000 1x35000
2 1x35000 NaN 1x35000 1x35000
3 1x35000 NaN 1x35000 NaN
...
16 1x35000 1x35000 NaN 1x35000
为避免误解:取第一列中每个数组的第一个元素并取均值。然后取第一列中每个数组的第二个元素并再次取平均值。最后,我想要一个 1x10 数据框,每列一个 1x35000 数组。该数组应该是我以前的数组的元素平均值。
1 2 3 ... 10
1 1x35000 1x35000 1x35000 1x35000
您是否有一个想法,最好不使用 for 循环而优雅地到达那里?
【问题讨论】:
-
鉴于混合 dtype 数据(使用 NaN),我认为迭代地执行每个单元格的平均值可能是这里的方法。
-
我希望避免 for 循环:p
-
然后查看this post中的两个矢量化解决方案。
标签: python pandas numpy mean elementwise-operations