【问题标题】:Python Regression of Categorical data with interactions具有交互作用的分类数据的 Python 回归
【发布时间】:2018-02-08 11:34:47
【问题描述】:

我发现人们如何使用 sklearn 在 Python 上进行线性回归,并使用他们的数据进行 reg.fit(),但这只有在您正在寻找类似的回归时才允许您这样做 y = Ax1 + Bx2 +Cx3

但是,如果我的分类数据具有某种交互作用,我希望变量相乘而不是相加,该怎么办? 类似y = (Ax1)*(Bx2)*(Cx3)

【问题讨论】:

    标签: python pandas scikit-learn linear-regression non-linear-regression


    【解决方案1】:

    为了照顾输入特征(例如 x1、x2 和 x3)之间的交互,通常的做法是创建多项式特征,例如 x1^3、x1^2*x2 + x1*x2*x3 + ... + x3^3。例如,在您的情况下,您的 y 方程如下所示:

    y = A*x1^3 + B*x2^3 + C*x3^3 + D*x1^2*x2 + E*x1*x2*x3 + F*x1*x2^2 + ...
    

    我希望你明白这一点。为了处理分类数据,有像 One-Hot Encoding 这样的技术,可以为您的数据提供非常简单的矢量表示。 Scikit Learn 实现了 One-hot 编码

    如果您想将您的学习提升到一个新的水平,您还可以研究支持向量机和神经网络等训练算法

    【讨论】:

      猜你喜欢
      • 2021-10-12
      • 1970-01-01
      • 2014-09-28
      • 1970-01-01
      • 2018-05-02
      • 2021-04-09
      • 2015-07-30
      • 2020-12-10
      • 2012-05-20
      相关资源
      最近更新 更多