【问题标题】:make a new variable from existing data in pandas dataframe从熊猫数据框中的现有数据中创建一个新变量
【发布时间】:2013-06-27 00:04:13
【问题描述】:

我需要一些帮助来在数据框中形成一个新变量 我有一个非常大的数据集,我想从另一列中的现有数据中创建一个新变量。 这是一个例子。

>>> df
   A  B   
0  a  1  
1  b  2  
2  c  3  
3  a  5  
4  d  6  

我想用 A 中的值 a 和 c 创建一个新列,并将它们命名为 ac,b 和 d,并将它们命名为 bd 最终结果应该是这样的。将它们从 A 分组,并在新列中为该组指定一个新名称。

>>> df
   A  B   C
0  a  1  ac
1  b  2  bd
2  c  3  ac
3  a  5  ac
4  d  6  bd

/乔纳斯

【问题讨论】:

  • C 中的映射是如何确定的?
  • a 或 c 应在 C 列中产生 ac...即 a 和 c 应设置为属于名为 ac 的组。

标签: python dataframe pandas


【解决方案1】:
In [4]: mapper = dict(a = 'ac', b = 'bd', c = 'ac', d = 'bd')

In [5]: df['C'] = [ mapper[x] for x in df['A'] ]

In [6]: df
Out[6]: 
   A  B   C
0  a  1  ac
1  b  2  bd
2  c  3  ac
3  a  5  ac
4  d  6  bd

【讨论】:

  • 谢谢杰夫!这就是我要找的!!
猜你喜欢
  • 2021-06-02
  • 1970-01-01
  • 1970-01-01
  • 2022-01-23
  • 2022-09-24
  • 1970-01-01
  • 2017-08-30
  • 2016-08-28
  • 1970-01-01
相关资源
最近更新 更多