【发布时间】:2017-06-14 22:35:03
【问题描述】:
有没有办法检查 pandas 数据框中列的线性依赖关系?例如:
columns = ['A','B', 'C']
df = pd.DataFrame(columns=columns)
df.A = [0,2,3,4]
df.B = df.A*2
df.C = [8,3,5,4]
print(df)
A B C
0 0 0 8
1 2 4 3
2 3 6 5
3 4 8 4
有没有办法表明B 列是A 的线性组合,但C 是独立列?我的最终目标是在数据集上运行泊松回归,但我不断收到LinAlgError: Singular matrix 错误,这意味着我的数据框不存在逆向,因此它包含依赖列。
我想提出一种编程方式来检查每个功能并确保没有依赖列。
【问题讨论】:
-
您应该能够通过
numpy和这篇文章:stackoverflow.com/questions/28816627/… 实现您所需要的
标签: python pandas dataframe linear-algebra