【发布时间】:2021-05-04 06:27:54
【问题描述】:
我正在做一个机器学习项目。预处理数据后,我需要进行特征提取。在我的数据集中,我有 25 个班级(数据集中的字母表),每个班级有 20 个科目(我得到字母表的次数)。使用函数groupby(),它们 (25*20 = 500) 都具有相同的大小 (1000)。我想通过计算maccs 列均值将 1000 个采样点压缩为 50 个采样点。
我的数据集如下所示:
这是我尝试过的,但没有奏效。它给出了一个“SeriesGroupBy”对象没有属性“iloc”错误。
for i in np.arange(211, 890, 20):
new_dataset = new_dataset.groupby(['alphabet', 'subject'])['maccs'].iloc[i-10:i+20,6].mean(axis=0)
在使用groupby() 函数时如何访问行和列?或者我可以用什么来做类似的事情?
【问题讨论】:
标签: python pandas-groupby slice feature-extraction