【发布时间】:2022-08-23 04:09:56
【问题描述】:
我有一个包含 11 000k 行的数据框。有多个列,但我只对其中 2 个感兴趣:TagName 和 Samples_Value。一个标签可以在行之间重复多次。我想计算每个标签的平均值并使用每个标签的平均值创建一个新的数据框。我真的不知道如何遍历行以及如何计算平均值。任何帮助将不胜感激。谢谢!
Name DataType TimeStamp Value Quality
Food Float 2019-01-01 13:00:00 105.75 122
Food Float 2019-01-01 17:30:00 11.8110352 122
Food Float 2019-01-01 17:45:00 12.7932892 122
Water Float 2019-01-01 14:01:00 16446.875 122
Water Float 2019-01-01 14:00:00 146.875 122
RangeIndex: 11140487 entries, 0 to 11140486
Data columns (total 6 columns):
Name object
Value object
这就是我所拥有的,我知道这真的很菜,但我很难穿过行。
for i in range(0, len(df):
if((df.iloc[i][\'DataType\']!=\'Undefined\')):
print df.loc[df[\'Name\'] == df.iloc[i][\'Name\'], df.iloc[i][\'Value\']].mean()
-
我可以回答我只有您发布了可复制的数据样本而不是图像,以便我可以测试我的代码。提示:使用
groupby和mean。 -
@SergeBallesta 这样做了,希望对您有所帮助
标签: python pandas dataframe mean