【发布时间】:2018-02-24 18:15:26
【问题描述】:
numpy.unique() vs Pandas.get_dummies()
numpy.unique() 将数据转换为所有 K 个类别的数组,并将每个值的索引作为新列返回,而 get_dummies() 只是创建 k 列,每个列都有 (0,1) 值。
哪种方法将分类数据转换为数字最适合机器学习?为什么?
【问题讨论】:
标签: python pandas numpy machine-learning scikit-learn