【发布时间】:2020-11-23 15:10:57
【问题描述】:
我有 4 个具有 5 个特征的样本数据,作为一个数组,data。
import numpy as np
data = np.array([[1,1,1,1,0],
[0,0,0,0,0],
[1,1,1,1,0],
[1,0,0,0,0]])
print (data)
n_samples, n_features = data.shape = (4,5)
当我按如下方式对其应用 StandardScaler 时,它是跨特征还是跨样本标准化数据?
from sklearn.preprocessing import StandardScaler, MinMaxScaler
result = StandardScaler().fit_transform(data)
print (result)
[[ 0.57735027 1. 1. 1. 0. ]
[-1.73205081 -1. -1. -1. 0. ]
[ 0.57735027 1. 1. 1. 0. ]
[ 0.57735027 -1. -1. -1. 0. ]]
在机器学习中,跨样本或跨特征数据标准化的最佳实践是什么?
【问题讨论】:
标签: numpy tensorflow machine-learning keras scikit-learn