【问题标题】:Stuck doing multiple linear regression with python坚持用python做多元线性回归
【发布时间】:2020-03-14 03:28:04
【问题描述】:

我有以下特征向量 [Y, x1, x2, x3, x4, ... , x31, x32, x33] 我创建了一个大约 100 行/34 列数据的数据集 (我想根据进餐的营养信息以及患者的年龄、体重、糖尿病药物(如果有的话)等来预测血糖...)

X = dataset.drop(columns="Y")
y = dataset["Y"]
X_train,X_test, y_train, y_test= train_test_split(X,y,test_size=0.2,random_state=0)

我只是不确定从这里去哪里。我看过很多视频并阅读了很多博客,但这让我很困惑,我不确定多重线性回归是否真的有效

任何指导将不胜感激:)

【问题讨论】:

  • 您想自己编写代码用于教育目的,还是只对最终解决方案感兴趣?
  • 我想自己写,但我需要一些关于使用什么回归模型的帮助,我尝试使用示例作为参考来实现,但我一直收到太多错误
  • Here 是一个快速教程。

标签: python machine-learning scikit-learn regression


【解决方案1】:

您可以从这里做“n”件事情。您可以从 Internet 上的任何地方找到示例代码,但这里是我建议您做的事情。 我不确定您是要构建线性回归模型还是使用现有的多元线性回归模型来分析数据。我假设稍后。从这里你可以

  1. 识别输入数据中的多重共线性
  2. 使用所有参数创建一个多元线性回归模型,并确定调整后的 R 平方值。
  3. 使用 t 检验确定回归变量的显着性
  4. 使用单位正态缩放标准化回归系数并确定哪个变量对输出具有重要意义。

作为初学者,我建议你选择一些随机变量并创建一个线性回归模型,而不用担心模型效率。您可以按照互联网上的任何可用资源来执行此任务。谷歌 sklearn 多元线性回归,用于在互联网上查找示例。

【讨论】:

    猜你喜欢
    • 2013-07-17
    • 2016-10-15
    • 1970-01-01
    • 2013-07-14
    • 2010-11-23
    • 2014-05-20
    • 1970-01-01
    • 2020-10-04
    • 2020-01-02
    相关资源
    最近更新 更多