【问题标题】:How do I average historical statistics from a dataset with sports results?如何从具有体育成绩的数据集中平均历史统计数据?
【发布时间】:2019-06-22 13:24:21
【问题描述】:

我有网球数据集,这是头部:

现在我想为给定的 ID1 平均 FS_1。换句话说,我想从这个数据集中的数据中获得所有球员的平均首发百分比。并且所有玩家都会出现几次。

我知道我可以这样做来获取字段的平均值;

def mean(arr):
  return sum(arr) / len(arr)

mean(dataset['FS_1'])

但是我如何获得特定球员的平均水平?

【问题讨论】:

  • 您反复引用“数据集”,但该数据集的格式是什么?它在熊猫数据框中吗?
  • 是的,抱歉。这是一个 xlsx 文件,在 pandas 数据帧中读取。
  • @RoryDaulton 忘了给你加标签,但你知道它是怎么做的吗,或者你知道有什么资源可以解释它是怎么做的吗?
  • 不,我对熊猫知之甚少。
  • 你能分享你的 XLXS 文件和从 XLSX 检索数据集的代码吗?

标签: python dataframe statistics dataset


【解决方案1】:

Pandas groupby 方法应该可以解决问题:

df.groupby(['ID1']).mean()['FS_1']

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-08-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-08-25
    相关资源
    最近更新 更多