【发布时间】:2016-10-11 17:25:34
【问题描述】:
我有来自 kaggle 的 ATP 数据集。我正在R中研究它。在数据集中,我有各种变量,如比赛日期、城市、锦标赛名称、获胜者姓名、失败者姓名、比赛获胜者赢得的总比赛、比赛失败者赢得的总比赛、获胜者赢得的总比赛, 输家赢得的总局数等等。
我的注意力集中在比赛获胜者和比赛失败者列上。 这些列是具有玩家姓名值的因子变量。
现在我想要绘制不同玩家的比赛胜负比图(比如前 5 名或前 10 名具有最高胜负比的玩家),其中 x 轴代表玩家的名称,y 轴表示该玩家的胜负比。
如何创建此特定图表。我尝试在 dplyr 包中使用管道衬里,如下所示: 赢家和输家是阶乘变量。
roger_wins <- atp %>% filter(Winner == "Federer R.") %>% count(Winner)
roger_loss <- atp %>% filter(Loser == "Federer R.") %>% count(Loser)
但是使用这种方式必须为每个玩家进行硬编码。如何使用前 5 名或前 10 名玩家的代码执行此操作(根据输赢) 请在 R 中提供解决方案。 这是可以找到数据集的页面: https://www.kaggle.com/jordangoblet/atp-tour-20002016
【问题讨论】:
-
请使用
dput()将一小部分数据粘贴到您的问题中,而不是派人到其他网站下载数据。