【发布时间】:2021-04-22 17:01:25
【问题描述】:
上周我问了similar question,现在我遇到了类似的问题,但我无法转换在这种情况下收到的答案。
基本上,我有一个名为 comms 的数据框,如下所示:
articleID Material commentScore
1234 News 0.75
1234 News -0.1
5678 Sport 1.33
5678 News 0.75
5678 Fashion 0.02
7412 Politics -3.45
还有另一个名为arts的数据框,它看起来像这样:
articleID wordCount byLine
1234 1524 John
5678 9824 Mary
7412 3713 Sam
我想简单地计算每个articleID 有多少个comms,并将这个数字存储在名为commentNumber 的arts 数据框的新列中。
我想我必须使用groupby、count() 或者merge,但我不知道为什么。
预期输出
articleID wordCount byLine commentNumber
1234 1524 John 2
5678 9824 Mary 3
7412 3713 Sam 1
提前致谢! 安德烈亚
【问题讨论】:
-
您的预期/期望输出是什么?请提供包含已处理数据的示例数据框。
-
你说得对,我忘了提供。现已编辑
标签: python-3.x pandas dataframe