【问题标题】:How to group same element entry and replace it by an average value?如何对相同的元素条目进行分组并用平均值替换它?
【发布时间】:2019-09-28 08:11:01
【问题描述】:

一个带有城市和用品的数据框,它可以包含其他列(可能有不同的值)。输出供应量最高的城市名称,如果有多个条目,任何城市输出平均供应量最高的城市名称

示例:

数据框

城市供应地址 columnx columny

3000 xyz xyz xyz

B 4000 xyz xyz xyz

C 1000 xyz xyz xyz

4000 xyz xyz xyz

D 3000 xyz xyz xyz

B 1000 xyz xyz xyz

那么输出应该是:

A市供应3500

使用数据框功能对城市进行分组,并输出平均供应量最高的城市。

【问题讨论】:

  • 您是否正在寻找不使用 pandas 的解决方案(“使用 python 内置库”)?或者您是否允许使用熊猫(“给出了一个数据框”)? python 中的数据框通常是指 pandas 数据框或 dask 数据框。你自己试过吗?

标签: python pandas dataframe series


【解决方案1】:

如果您使用pandas,这将按城市计算平均供应量:

dataframe.groupby('city').supplies.mean()

如果您想提取物资平均值最大的城市,您可以这样做:

dataframe.groupby('city').supplies.mean().idxmax()

【讨论】:

  • 不用排序,可以用idxmax()代替。
  • 谢谢,这是一个很好的提示!我已更改代码以反映您的建议
猜你喜欢
  • 1970-01-01
  • 2023-03-26
  • 1970-01-01
  • 2016-09-07
  • 2017-04-11
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多