【发布时间】:2018-08-19 03:39:11
【问题描述】:
我以前问过这个问题,但我得到的答案并不像我想象的那样完美,所以我在这里。
上一个问题:Defining a function for changing column values and creating new datasets
我正在尝试定义一个函数,它将采用数据框并更改列中的值以创建多个新数据框。
例如,从 df1 看起来像:
df1:
class colB colC
0 1 1b 1c
1 2 2b 2c
2 3 3b 3c
3 1 4b 4c
4 2 5b 5c
我正在尝试创建多个二进制类来实现一对多分类。所以函数会创建...
df2:
class colB colC
0 1 1b 1c
1 -1 2b 2c
2 -1 3b 3c
3 1 4b 4c
4 -1 5b 5c
df3:
class colB colC
0 -1 1b 1c
1 1 2b 2c
2 -1 3b 3c
3 -1 4b 4c
4 1 5b 5c
df4:
class colB colC
0 -1 1b 1c
1 -1 2b 2c
2 1 3b 3c
3 -1 4b 4c
4 -1 5b 5c
等等。所有唯一值都是从 1 到 120 的增量值。
上一个答案给出的问题 (np.identity) 是它创建的数据帧将每个单个值都视为 1 或 -1,而不是相应地将相同的值归类为同一类。
谢谢
【问题讨论】:
-
介意仔细检查
df4的输入吗?我认为只有第二行应该是1
标签: python pandas function dataframe classification