【发布时间】:2013-06-27 00:04:13
【问题描述】:
我需要一些帮助来在数据框中形成一个新变量 我有一个非常大的数据集,我想从另一列中的现有数据中创建一个新变量。 这是一个例子。
>>> df
A B
0 a 1
1 b 2
2 c 3
3 a 5
4 d 6
我想用 A 中的值 a 和 c 创建一个新列,并将它们命名为 ac,b 和 d,并将它们命名为 bd 最终结果应该是这样的。将它们从 A 分组,并在新列中为该组指定一个新名称。
>>> df
A B C
0 a 1 ac
1 b 2 bd
2 c 3 ac
3 a 5 ac
4 d 6 bd
/乔纳斯
【问题讨论】:
-
C 中的映射是如何确定的?
-
a 或 c 应在 C 列中产生 ac...即 a 和 c 应设置为属于名为 ac 的组。