【发布时间】:2015-08-09 00:22:58
【问题描述】:
使用 sklearn 的 MinMaxScaler,我按如下方式缩放我的数据。
min_max_scaler = preprocessing.MinMaxScaler()
X_train_scaled = min_max_scaler.fit_transform(features_train)
X_test_scaled = min_max_scaler.transform(features_test)
但是,当打印 X_test_scaled.min() 时,我有一些负值(这些值不在 0 和 1 之间)。这是因为我的测试数据中的最小值低于训练数据,其中 min max scaler 是合适的。
在 0 和 1 值之间没有完全标准化的数据对 SVM 分类器有多大影响?另外,将训练数据和测试数据连接到一个矩阵中,执行 min-max 缩放以确保值在 0 和 1 之间,然后再次分离它们是不是不好的做法?
【问题讨论】:
标签: python machine-learning scikit-learn svm