【发布时间】:2023-03-07 15:32:01
【问题描述】:
假设我有一个包含以下国家/地区的数据框:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
我知道有一个 pd.get_dummies 函数可以将国家/地区转换为“单热编码”。但是,我希望将它们转换为索引,这样我会得到cc_index = [1,2,1,3]。
我假设有一种比使用 get_dummies 和 numpy where 子句更快的方法,如下所示:
[np.where(x) for x in df.cc.get_dummies().values]
在 R 中使用“因子”更容易做到这一点,所以我希望 pandas 也有类似的东西。
【问题讨论】:
-
你的意思是
cc_index = [0,1,0,2]? -
当然,忘了python 0索引
-
分类系列或 DataFrame 中的列可能会有所帮助。
标签: python pandas series categorical-data binning