【发布时间】:2017-01-04 18:02:21
【问题描述】:
我有一个包含 70 个变量的数据集,我想对其进行多项式回归。如果列数是三/四,我可以手动编写这样的代码--
model <- lm(y ~ poly(var1,3) + poly(var2,3) + poly(var4,4)
如果我们有 70 个变量,我们将如何处理?我们应该手动输入所有变量的名称还是有更简单的方法?
【问题讨论】:
-
您是否有任何关于要拟合每个变量的多项式程度的先验知识(例如,来自商业)?一般来说,多项式回归容易过拟合,泛化性较差。
-
这里我知道每个变量代表什么,但不知道它们的多项式程度.. 简单的线性模型给出的 Rsquared 值非常差(大约 0.02)我想知道我们如何建模多项式一般回归...
-
您的第一个问题“如果我们有 70 个变量,我们将如何解决这个问题?”如果这意味着我们将如何以自动化方式跨多个变量生成它,则可以将其视为编程问题。您的第二个问题与 SO 无关,会在 CV 上找到更好的家。如果正如您的评论所暗示的那样,您的主要问题与统计建模有关,我会在此处删除该问题,并在 CV 上发布一个问题以强调这一点。
-
已删除问题的第二部分...
-
谢谢,adibender 也提出了同样的建议……
标签: r linear-regression polynomials