【发布时间】:2020-03-27 17:19:21
【问题描述】:
我正在尝试对数据集中给定数据大小的加密时间进行简单回归。我是 python 和 statsmodels 的初学者,但我认为 OLS 回归得到了奇怪的结果,因为它为我提供了每个数据大小的系数,例如:
DataSize[T.1024] 0.0001
DataSize[T.1040] 0.0003
DataSize[T.1056] 0.0004
DataSize[T.1072] 0.0006
DataSize[T.1088] 0.0007
这是我开发的代码:
encrypt_key_16 = select_total_encrypt_time.loc[select_total_encrypt_time['KeySize'] == 16]
y4, X4 = dmatrices('Measure ~ DataSize', data=encrypt_key_16, return_type='dataframe')
mod4 = sm.OLS(y4, X4)
result4 = mod4.fit()
我做错了吗?
提前感谢您的回答。
【问题讨论】:
-
看起来
DataSize被解释为分类。确保它具有数字 dtype,例如浮动64。 int 也应该没问题,但不是 string 或类似的。 -
感谢您的回答。不幸的是,DataSize 矩阵 X4 确实是 float64 类型。所以我认为这不是问题所在。
-
你检查
encrypt_key_16.dtypes或np.asarray(encrypt_key_16['DataSize']).dtype了吗?
标签: python