【发布时间】:2017-04-10 09:35:15
【问题描述】:
我正在 python 中研究 KNN 算法,并尝试使用 MinMaxScaler 标准化我的数据帧,以将数据转换为 0 到 1 之间的范围内的数据。
但是,当我返回输出时,我观察到某些列的 min/max 输出超过了 1。我用错了吗?
使用的代码是:
kdd_data_10percent = pandas.read_csv("data/kdd_10pc", header=None, names = col_names)
features = kdd_data_10percent[num_features].astype(float)#num_features contain the specific column labels i wish to extract
features.apply(lambda x: MinMaxScaler().fit_transform(x))
Features 包含包含列的数据框(例如 wrong_fragment、urgent ...)。
如果我理解正确,在执行 MinMaxScaler 之后,返回的结果将确保每列值将被规范化为仅从 0 -1 的范围。我说的对吗?
【问题讨论】:
-
stackoverflow.com/a/21765852/356729 正是您要找的东西
标签: python scikit-learn knn sklearn-pandas