【发布时间】:2014-03-05 20:06:54
【问题描述】:
假设我有两个矩阵,一个原始矩阵和一个参考矩阵:
import pandas as pa
print "Original Data Frame"
# Create a dataframe
oldcols = {'col1':['a','a','b','b'], 'col2':['c','d','c','d'], 'col3':[1,2,3,4]}
a = pa.DataFrame(oldcols)
print "Original Table:"
print a
print "Reference Table:"
b = pa.DataFrame({'col1':['x','x'], 'col2':['c','d'], 'col3':[10,20]})
print b
表格如下所示:
Original Data Frame
Original Table:
col1 col2 col3
0 a c 1
1 a d 2
2 b c 3
3 b d 4
Reference Table:
col1 col2 col3
0 x c 10
1 x d 20
现在我想从原始表 (a) 的第三列 (col3) 中减去两个表的第二列匹配的行中的引用表 (c) 中的值。所以表二的第一行应该将值 10 添加到第三列,因为列是 col2 的表 b 的行是 'c' 在 col3 中的值是 10。说得通?下面是一些执行此操作的代码:
col3 = []
for ix, row in a.iterrows():
col3 += [row[2] + b[b['col2'] == row[1]]['col3']]
a['col3'] = col3
print "Output Table:"
print a
产生以下输出:
Output Table:
col1 col2 col3
0 a c [11]
1 a d [22]
2 b c [13]
3 b d [24]
我的问题是,有没有更优雅的方法来做到这一点?此外,“col3”中的结果不应该是列表。也欢迎使用 numpy 的解决方案。
【问题讨论】: