【发布时间】:2018-06-02 18:51:05
【问题描述】:
我正在为机器学习生成我的特征数据集,并且我有一个 2d numpy 数组 X,其中 X.shape = (n, d) - n 个样本,d 个特征。
现在我使用 one-hot-encoding 生成一个新特征 - f 其中 f.shape = (n, 1, k) - n 个样本,k 个标签。
对我来说,将这个新特征添加到现有特征数据集的最佳方式是什么?
【问题讨论】:
-
要素数据集的最终形状是什么?
-
我不确定它应该是什么样子。我正在使用 sklearn 的库,为我现有的功能集实现单热标签功能的标准方法是什么?
-
我会把它当作 k 新功能
np.c_[X, f.reshape(n, k)].
标签: python numpy machine-learning dataset feature-extraction