【问题标题】:Residual Estimator残差估计器
【发布时间】:2018-08-17 07:15:55
【问题描述】:

我有这样一个管道:

attribute_est = Pipeline([
     ('jsdf', DictVectorizer()),
     ('clf', Ridge())
    ])

在那里我传递如下数据:

{
  'Master_card' : 1,
  'Credit_Cards': 1,
  'casual_ambiance': 0,
  'Classy_People': 0
}

我的模型不能很好地预测。现在我被提议:

您可能会发现很难找到一个表现良好的回归量 足够的。一种常见的解决方案是使用线性模型来拟合线性 部分数据,并使用非线性模型来拟合残差 线性模型无法拟合。建立一个残差估计器 一个参数两个其他估计器。它应该使用第一个来适应 原始数据和第二个以拟合第一个的残差。

残差估计器是什么意思?能给我举个例子吗?

【问题讨论】:

    标签: python scikit-learn


    【解决方案1】:

    residual 是真实数据值与某些估计器预测的值之间的误差。最简单的例子是线性回归的情况,其中残差是某些数据的最佳线性拟合与实际数据点之间的距离。一条线的最小二乘拟合最小化这些平方残差的总和。

    您收到的建议建议使用两个估算器。第一个适合数据本身。在线性回归的情况下,这是一个最小二乘线性拟合,可能使用类似scikit-learn's linear regression model 的东西。

    然后,第二个估计器将尝试拟合残差,即数据的线性拟合与实际数据点之间的差异。在最小二乘情况下,这有效地去除了数据的趋势,然后拟合剩余的数据。如果您期望数据实际上一条带有加性高斯噪声的线,您可能会将其选为高斯分布。但是,如果您对底层噪声分布有所了解,则可以将其用作您的第二个估算器。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2016-11-03
      • 1970-01-01
      • 2018-06-05
      • 2016-05-26
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-03-25
      相关资源
      最近更新 更多