【问题标题】:OLS Regression with statsmodels giving many coefficientsOLS 回归与 statsmodels 给出许多系数
【发布时间】:2020-03-27 17:19:21
【问题描述】:

我正在尝试对数据集中给定数据大小的加密时间进行简单回归。我是 python 和 statsmodels 的初学者,但我认为 OLS 回归得到了奇怪的结果,因为它为我提供了每个数据大小的系数,例如:

DataSize[T.1024] 0.0001
DataSize[T.1040] 0.0003
DataSize[T.1056] 0.0004
DataSize[T.1072] 0.0006
DataSize[T.1088] 0.0007

这是我开发的代码:

    encrypt_key_16 = select_total_encrypt_time.loc[select_total_encrypt_time['KeySize'] == 16]
    y4, X4 = dmatrices('Measure ~ DataSize', data=encrypt_key_16, return_type='dataframe')
    mod4 = sm.OLS(y4, X4)
    result4 = mod4.fit()

我做错了吗?

提前感谢您的回答。

【问题讨论】:

  • 看起来DataSize 被解释为分类。确保它具有数字 dtype,例如浮动64。 int 也应该没问题,但不是 string 或类似的。
  • 感谢您的回答。不幸的是,DataSize 矩阵 X4 确实是 float64 类型。所以我认为这不是问题所在。
  • 你检查encrypt_key_16.dtypesnp.asarray(encrypt_key_16['DataSize']).dtype了吗?

标签: python


【解决方案1】:

好的,我想我找到了问题所在。当我打印数据帧 X4 时,我得到以下输出:

Output when printing X4

所以我需要以某种方式使其只有一列 DataSize。

【讨论】:

    猜你喜欢
    • 2014-03-30
    • 2014-02-09
    • 2015-12-31
    • 2016-05-03
    • 2020-09-12
    • 2016-12-29
    • 2014-12-19
    • 2018-07-27
    相关资源
    最近更新 更多