【问题标题】:ValueError: Found input variables with inconsistent number of samples: [14508, 1]ValueError:发现样本数量不一致的输入变量:[14508, 1]
【发布时间】:2021-10-09 23:20:15
【问题描述】:

所以我正在尝试训练一个多元线性回归模型,并且我正在尝试输入 xTrain 和 yTrain。 xTrain 由两个特征组成,而 y 只是一个标签。

xTrain 的格式为 [[a, b], [c, d]],yTrain 的格式为 [[e, f]]。

我做了 model.fit(xTrain, [yTrain]) # yTrain 是一维数组,所以我转换为二维。

x 和 y 值的数量相同(每个 y 值 2 个特征)!

为什么会在标题中出现错误,我该如何解决?

【问题讨论】:

  • 请发布一个最小可重现示例和错误的堆栈跟踪。

标签: python machine-learning linear-regression


【解决方案1】:

因为xTrain和yTrain的行数应该是一样的,

例如,假设我在 xTrain 中有 10 行和 5 列,yTrain 应该有 10 行

而且你不需要将 yTrain 转换为二维数组,一维数组就可以了,

model.fit(xTrain, yTrain) 可以正常工作。

【讨论】:

  • 行数是什么意思,因为在我提供的示例中,我提供了 a 和 b...每个 y 值恰好有两个对应的 x 值,这是没有显示的?
猜你喜欢
  • 2022-01-16
  • 2021-07-29
  • 2020-11-15
  • 2020-07-05
  • 2017-06-30
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-09-27
相关资源
最近更新 更多