【发布时间】:2020-10-06 02:22:30
【问题描述】:
我一直在使用模块 pandas 进行数据抓取,尽管我了解如何 (),但我仍然不确定如何比较 CSV 的 2 列或更多列。以下面的代码为例,我想知道,例如分别发布更多动作、射击和平台游戏的 3 家发行商。我写了下面的代码,但输出显示“False”而不是流派的名称。至少我相信前 3 名的出版商是正确的,但我不确定。有人可以看看吗?
import pandas as pd
data = pd.read_csv("https://sites.google.com/site/dr2fundamentospython/arquivos/Video_Games_Sales_as_at_22_Dec_2016.csv")
a = data['Publisher'].groupby((data['Genre'] == 'Action')).value_counts().head(3)
print(a)
s = data['Publisher'].groupby((data['Genre'] == 'Shooter')).value_counts().head(3)
print(s)
p = data['Publisher'].groupby((data['Genre'] == 'Platform')).value_counts().head(3)
print(p)
另外,我应该找出动作、射击和平台游戏销量最高的前 3 家发行商。我试着写这个,但没有用。如何同时使用同一列的 3 个项目,并将它们与另外 2 个列进行比较?如果我想包含一个时间范围,例如比较过去 10 年的所有这些列,该怎么办?
import pandas as pd
data = pd.read_csv("https://sites.google.com/site/dr2fundamentospython/arquivos/Video_Games_Sales_as_at_22_Dec_2016.csv")
a = ((data['Genre'] == 'Action') & (data['Genre'] == 'Shooter') & (data['Genre'] == 'Platform')).groupby((data['Publisher']) & (data['Global_Sales'])).value_counts().head(3)
print(a)
【问题讨论】: