【发布时间】:2020-11-10 13:19:28
【问题描述】:
我有一个非常奇怪的数据结构,它是一个元组列表。每个元组有五个元素,其中第一个是标识字符串,其他四个是浮点数字符串(很奇怪,它们不仅仅是浮点数)。 抱歉,我从其他人那里得到了这些数据。
我想对第一个索引相同的 2-5 个数字的所有数字进行平均。 示例:
[('ch', ' 0.8307', '0.8583', '0.8047', ' 0.969'),
('de', ' 0.721', '0.7529', '0.6917', ' 0.968'),
('en', ' 0.8441', '0.8732', '0.8168', ' 0.9569'),
('fn', ' 0.8207', '0.8574', '0.7870', ' 0.9609'),
('ch', ' 0.466', '0.572', '0.7733', ' 0.969'),
('de', ' 0.322', '0.385', '0.5431', ' 0.968'),
('sp', ' 0.7609', '0.7893', '0.7344', ' 0.9663'),
('ti', ' 0.8135', '0.8430', '0.7860', ' 0.9662')]
输出应该只是将具有相同第一个索引的所有元素收缩在一起并平均它们的值,所以它会是这样的(我没有在我的示例输出中平均这些值):
[('ch', ' 0.8307', '0.8583', '0.8047', ' 0.969'),
('de', ' 0.721', '0.7529', '0.6917', ' 0.968'),
('en', ' 0.8441', '0.8732', '0.8168', ' 0.9569'),
('fn', ' 0.8207', '0.8574', '0.7870', ' 0.9609'),
('sp', ' 0.7609', '0.7893', '0.7344', ' 0.9663'),
('ti', ' 0.8135', '0.8430', '0.7860', ' 0.9662')]
我可以在这里做些什么非常聪明的事情,而不是制作一个巨大的 for 循环来提取所有内容?
【问题讨论】:
-
是的,但很可能是
pandas而不是numpy- 添加了标签以便那些向导可以提供帮助。 -
如果没有列出,也可能是结构化数组。
标签: python pandas numpy average