【发布时间】:2021-07-12 04:30:45
【问题描述】:
我有一个包含许多城市及其相应温度的数据框:
CurrentThermostatTemp
City
Cradley Heath 20.0
Cradley Heath 20.0
Cradley Heath 18.0
Cradley Heath 15.0
Cradley Heath 19.0
... ...
Walsall 16.0
Walsall 22.0
Walsall 20.0
Walsall 20.0
Walsall 20.0
[6249 rows x 1 columns]
唯一值是:
Index(['Cradley Heath', 'ROWLEY REGIS', 'Smethwick', 'Oldbury',
'West Bromwich', 'Bradford', 'Bournemouth', 'Poole', 'Wareham',
'Wimborne',
...
'St. Helens', 'Altrincham', 'Runcorn', 'Widnes', 'St Helens',
'Wakefield', 'Castleford', 'Pontefract', 'Walsall', 'Wednesbury'],
dtype='object', name='City', length=137)
我的目标是进行单向方差分析,即
from scipy.stats import f_oneway
对于数据框中的所有唯一值。也一样
SciPy.stats.f_oneway("all unique values")
并接收输出:所有变量的单向方差分析给出 {} 和 p 值 {} 这是我尝试过很多次但不起作用的方法:
all = Tempvs.index.unique()
Tempvs.sort_index(inplace=True)
for n in range(len(all)):
truncated = Tempvs.truncate(all[n], all[n])
print(f_oneway(truncated))
【问题讨论】:
标签: python pandas dataframe anova scipy.stats