【发布时间】:2017-10-06 09:17:41
【问题描述】:
设置
我正在使用 Scrapy 抓取房屋广告,然后使用 pandas 分析数据。
我使用 pandas 来计算几个住房特征的均值和中位数。
数据框df 看起来像,
district | rent | rooms | …
----------------------------
North | 200 | 3 | …
South | 300 | 1 | …
South | 300 | 1 | …
⋮ ⋮ ⋮ ⋮
问题
我想计算每个区n间公寓的平均租金。
我找到了一个答案here,这让我很接近,例如
df.loc[df['rooms'] == 1, 'rent'].mean()
但这计算的是整个城市的一居室公寓的平均租金。
要按地区进行,我想做类似的事情,
for d in district_set:
df.loc[df['rooms'] == 1 and df['district'] == d, 'rent'].mean()
其中district_set 包含所有可能的地区。
有什么建议吗?
我想获取下表,
district | avg rent 1R | avg rent 2R | …
----------------------------------------
North | 200 | 400 | …
South | 300 | 500 | …
⋮ ⋮ ⋮
【问题讨论】:
-
使用 groupby 和聚合均值
标签: python pandas conditional mean