【发布时间】:2016-03-08 10:34:20
【问题描述】:
我是熊猫的初学者。现在我想用熊猫实现决策树算法。首先,我将测试数据读入一个 padas.DataFrame,如下所示:
In [4]: df = pd.read_csv('test.txt', sep = '\t')
In [5]: df
Out[5]:
Chocolate Vanilla Strawberry Peanut
0 Y N Y Y
1 N Y Y N
2 N N N N
3 Y Y Y Y
4 Y Y N Y
5 N N N N
6 Y Y Y Y
7 N Y N N
8 Y N Y N
9 Y N Y Y
然后我将“花生”和“巧克力”分组,得到的是:
In [15]: df2 = df.groupby(['Peanut', 'Chocolate'])
In [16]: serie1 = df2.size()
In [17]: serie1
Out[17]:
Peanut Chocolate
N N 4
Y 1
Y Y 5
dtype: int64
现在,serie1 的类型是 Series。我可以访问 serie1 的值,但无法获得“花生”和“巧克力”的值。如何同时获得 serie1 的数量和 'Peanut' 和 'Chocolate 的值?
【问题讨论】:
-
为什么不能只重置索引?
serie1.reset_index()?
标签: pandas series multi-index