【发布时间】:2019-02-01 20:39:52
【问题描述】:
我的问题是我想预测一支球队对另一支球队的胜利,为此我希望在每场比赛中获得每支球队在比赛日期之前的胜率。
但是,使用df.groupBy("teamName").agg({"isVictory":"mean"}) 为我提供了无法使用的团队的全局信息,因为此时您不应该知道所有比赛的胜率。
所以我想要的是在这场比赛之前获得比赛的胜率,因为我知道我的 DataFrame 中有一个列 index 来保持比赛的顺序(即,如果比赛的索引较低比当前匹配的索引意味着之前已经进行过匹配,因此应该平均考虑这个匹配)
请注意,我的专栏是:
indexMatch, nameTeam, isVictoryTeam
(isVictoryTeam= 如果 Team1 获胜,如果 Team 失败则为 0)
数据集示例:
IndexMatch isVictoryTeam team winrate
0 1 1 a NaN
1 2 0 a 1
2 3 1 a 0.5
3 4 1 a 0.6667
胜率是预期的输出。
提前感谢您的帮助。
【问题讨论】:
-
您能否提供一个数据框示例以及所需的输出?
标签: python pandas group-by aggregate mean