【问题标题】:What are the parameters passed inside groupby function in pandas? [duplicate]pandas的groupby函数内部传递的参数是什么? [复制]
【发布时间】:2021-10-18 08:10:27
【问题描述】:

我正在寻找一些示例代码并找到了这个项目:https://www.fatalerrors.org/a/machine-learning-create-your-own-movie-recommendation-system.html。我不明白这一行。

no_user_voted = ratings.groupby('movieId')['rating'].agg('count')

这里movieIdratingratings 数据框中的列。

我知道普通的 groupby 函数是做什么的,但我不明白这一行。有人可以解释一下这条线的作用吗?

【问题讨论】:

  • 什么令人困惑? .agg ?你查阅文档了吗?只有在您用尽所有其他选项后才应使用 Stackoverflow,这就是您可能会被否决的原因。
  • 很高兴看到其他人回答了您的问题,但我想知道您在发布 SO 之前从自己身上尝试过什么。确实,这是一个相对微不足道的问题,应该通过少量实验由您自己解决,而不是作为问题发布在 SO 上,更不用说您以 cmets 以外的形式得到答案。

标签: python pandas pandas-groupby


【解决方案1】:

它的工作原理与:

no_user_voted = ratings.groupby('movieId')['rating'].count()

这意味着对于列movieId(组)的每个值,仅通过聚合函数GroupBy.count 计算列rating 的缺失值。

区别只是count函数在你的代码中传递给GroupBy.agg

【讨论】:

  • @DeepakTatyajiAhire - 是的,如果没有缺失值,您的答案是正确的。否则是错误的。
  • @DeepakTatyajiAhire 虽然我不是对你的答案投了反对票的人,但我确实认为这些没有表现出适当研究和自我理解尝试的问题不应该受到赞赏和回答正确的答案形式,因为它只会激励他们发布更多此类问题,也会阻碍他们的成长。
  • 无论如何,我很高兴@jezrael 得到了学分和版主以及其他人的支持。
  • @DeepakTatyajiAhire - 是的,我认为另一个人的编辑答案不是很好。
  • @DeepakTatyajiAhire - 转换为社区 wiki - 所以我没有更多的学分了。
【解决方案2】:

该行计算每个唯一 movieId 的非缺失 rating 的数量

【讨论】:

    猜你喜欢
    • 2020-01-04
    • 1970-01-01
    • 1970-01-01
    • 2020-08-18
    • 2018-11-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-22
    相关资源
    最近更新 更多