【发布时间】:2018-10-12 03:36:02
【问题描述】:
我正在尝试根据其他列的值计算某些行中的差异。
使用下面的示例数据框,我想根据Code 列中的值计算Time 的差异。具体来说,我想循环并确定B 和A 之间的时间差。所以 B 中的时间 - A 中的时间。
我可以使用iloc 函数手动执行此操作,但我希望确定一种更有效的方法。特别是如果我必须多次重复这个过程。
import pandas as pd
import numpy as np
k = 5
N = 15
d = ({'Time' : np.random.randint(k, k + 100 , size=N),
'Code' : ['A','x','B','x','A','x','B','x','A','x','B','x','A','x','B']})
df = pd.DataFrame(data=d)
输出:
Code Time
0 A 89
1 x 39
2 B 24
3 x 62
4 A 83
5 x 57
6 B 69
7 x 10
8 A 87
9 x 62
10 B 86
11 x 11
12 A 54
13 x 44
14 B 71
预期输出:
diff
1 -65
2 -14
3 -1
4 17
【问题讨论】: