【发布时间】:2020-04-23 09:28:45
【问题描述】:
我正在尝试导入两个文件并比较 df1 中的值计数(按状态的数据)和 df2 中该状态的连续数字。
换句话说,在一个 Excel 文件中,我有如下内容:
State Food
Arizona Bananas
Arizona Pears
Arizona Pickles
Connecticut Potatoes
Connecticut Apples
等等。
所以我感兴趣的是状态出现的次数,值的计数。
在另一个文件中,我有一列包含 50 个州和一个数字。
我要做的基本上是创建一个数据框,按州显示该州在 df1 中出现的次数(所以这里是亚利桑那州为 3)除以第二个中与亚利桑那州对应的列中的数字数据框。这有意义吗?
第二个数据框包含每个州的总人口,因此上述 3/n 的输出将是人均水果。
【问题讨论】:
-
是的,这是有道理的。这称为连接:pandas.pydata.org/pandas-docs/stable/user_guide/merging.html