【发布时间】:2021-05-22 06:39:01
【问题描述】:
我有一个数据框,我在其中创建了一个新列,它将前三列(日期)与值相加。然后我根据人口列为每一行创建了一个比率。
我想为此数据集中每一行的“sum_of_days_rate”创建上下 95% 的置信水平。
我可以创建前三列的平均值,但不知道如何为这三列的总和创建下限值和上限值rate。
以下数据集示例:
data= {'09/01/2021': [74,84,38],
'10/11/2021': [43,35,35],
"12/01/2021": [35,37,16],
"population": [23000,69000,48000]}
df = pd.DataFrame (data, columns = ['09/01/2021','10/11/2021', "12/01/2021", "population"])
df['sum_of_days'] = df.loc[:, df.columns[0:3]].sum(1)
df['sum_of_days_rate'] = df['sum_of_days']/df['population'] * 100000
【问题讨论】:
标签: python scipy statistics statsmodels confidence-interval