【发布时间】:2018-10-02 15:16:35
【问题描述】:
我有一个框架moviegoers,其中包括邮政编码但不包括城市。
然后我将 moviegoers 重新定义为 zipcodes 并将 zipcodes 的数据类型更改为数据框而不是系列。
zipcodes = pd.read_csv('NYC1-moviegoers.csv',dtype={'zip_code': object})
我知道我需要的数据集 URL 是:https://raw.githubusercontent.com/mafudge/datasets/master/zipcodes/free-zipcode-database-Primary.csv。
我定义了一个数据框 zip_codes,用于调用该数据集中的数据并将数据集类型从系列更改为数据框,使其与 zipcodes 数据框的格式相同.
我想合并数据框,以便获得 电影观众 数据。但是,我想要的是州的缩写,而不是 zipcodes。这就是我遇到问题的地方。
最终目标是计算每个州的电影观众人数。理想输出示例:
CA 116
MN 78
NY 60
TX 51
IL 50
任何想法将不胜感激。
【问题讨论】:
-
不,您在哪里将数据集类型从系列更改为数据框。熊猫数据框的每一列都是熊猫系列。设置object就是将column的数据类型定义为字符串类型。