【发布时间】:2016-11-30 20:14:42
【问题描述】:
我有一个像下面这样的数据框,它的结构不是固定的,它可以在不同的时刻有不同的列数。
A_Name B_Info Value_Yn Value_Yn-1 Value_Yn-2 ...... Value_Y1
0 AA X1 0.9 0.8 0.7 ...... 0.1
1 BB Y1 0.1 0.2 0.3 ...... 0.9
2 CC Z1 -0.9 -0.8 -0.7 ...... -0.1
3 DD L1 -0.1 -0.2 -0.3 ...... -0.9
我想对 X 和 Y 值分别为的每一行执行线性回归
X = [n, n-1, n-2, .....2, 1]
Y = [Value_Yn, Value_Yn-1, Value_Yn-2.......Value_Y2, Value_Y1]
这里的 'n' 是以 'Value_' 为前缀的列数
假设 n = 9
我的价值是
对于第 0 行
X = [9, 8, 7, 6, 5, 4, 3, 2, 1]
Y = [0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1]
对于第 1 行
X = [9, 8, 7, 6, 5, 4, 3, 2, 1]
Y = [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]
其他行也一样...
我想要以这种格式输出...
A_Name B_Info Intercept Slope_Coefficent
0 AA X1 0 0.1
1 BB Y1 1 -0.1
2 CC Z1 0 -0.1
3 DD L1 -1 0.1
数据集很大,通过循环来做不是正确的方法......
【问题讨论】:
-
不太确定您在问什么...也许您想使用
multiprocessing并行执行多行? -
这只是一个转换,请看输出....我这里不是多处理的意思.....但是我想要每一行的回归..
标签: python numpy pandas regression