【发布时间】:2017-06-22 03:52:01
【问题描述】:
这显然很简单,但作为熊猫新手,我遇到了困难。
我有一个 CSV 文件,其中包含 3 列,即 State、bene_1_count 和 bene_2_count。
我想计算给定状态下 'bene_1_count' 和 'bene_2_count' 的比率。
df = pd.DataFrame({'state': ['CA', 'WA', 'CO', 'AZ'] * 3,
'bene_1_count': [np.random.randint(10000, 99999)
for _ in range(12)],
'bene_2_count': [np.random.randint(10000, 99999)
for _ in range(12)]})
我正在尝试以下操作,但它给了我一个错误: '没有要连接的对象'
df['ratio'] = df.groupby(['state']).agg(df['bene_1_count']/df['bene_2_count'])
我无法弄清楚如何“达到” groupby 的状态级别以获取列的比率。
我想要一个状态的列的比率,就像我想要我的输出如下:
State ratio
CA
WA
CO
AZ
【问题讨论】:
标签: python python-3.x pandas