【问题标题】:How to get two variables similarly scaled?如何使两个变量具有相似的比例?
【发布时间】:2021-12-09 21:37:02
【问题描述】:

我目前正在研究海事船舶数据以进行预测。在预处理阶段,我被要求将 Length(meters) 变量转换为使用 Gross_Tonnage 变量进行缩放。 总吨位的公式为 GT = 体积(立方米)x K

其中 K 是一个乘数。更多关于总吨位的信息可以找到here

我完全不知道如何转换 Length 变量。我知道体积以立方米为单位,而长度以线性米为单位。如何转换 Length 变量来完成这项工作?

【问题讨论】:

  • 这不是编程问题。
  • 要获得立方米,您需要三个维度,例如长度、宽度和高度(或深度)。这些 (LxBxH) 的乘积是 3-D 矩形(立方体)的体积,您可以通过密度因子 K 对其进行缩放以获得 GT 估计值。由于长度已经以米为单位,因此似乎无需进行缩放。

标签: python data-science data-preprocessing


【解决方案1】:

如果您想规范化两列以使值在同一范围内,您可以将以下转换分别应用于两列:

(X - X_min)/(X_max - X_min)

这将缩放两列以落在 0 和 1 的范围内。这称为 MinMax 缩放。 Sklearn 有一个功能可以做到这一点。

# import the function 
from sklearn.preprocessing import MinMaxScaler

# fit scaler on your data
X_norm = MinMaxScaler().fit(X)

X 将成为您的列,因此您将分别将其应用于两列。

【讨论】:

    猜你喜欢
    • 2018-01-10
    • 2021-10-01
    • 1970-01-01
    • 2022-11-22
    • 1970-01-01
    • 2019-09-18
    • 2023-02-22
    • 2010-12-16
    • 1970-01-01
    相关资源
    最近更新 更多