【发布时间】:2018-02-28 10:39:55
【问题描述】:
我有一个熊猫数据框
x = pd.DataFrame.from_dict({'row':[1, 1, 2, 2, 3, 3, 3], 'add': [1, 2, 3, 4, 5, 6, 7], 'take1': ['a', 'b', 'c', 'd', 'e', 'f', 'g'], 'take2': ['11', '22', '33', '44', '55', '66', '77'], 'range': [100, 200, 300, 400, 500, 600, 700]})
add range row take1 take2
0 1 100 1 a 11
1 2 200 1 b 22
2 3 300 2 c 33
3 4 400 2 d 44
4 5 500 3 e 55
5 6 600 3 f 66
6 7 700 3 g 77
我想按row 列对其进行分组,然后在add 列中添加条目,但从take1 和take2 中获取第一个条目,然后从范围中选择最小值和最大值:
add row take1 take2 min_range max_range
0 3 1 a 11 100 200
1 7 2 c 33 300 400
2 18 3 e 55 500 700
【问题讨论】:
-
你假设数据总是排序的,或者什么定义了“第一个条目”?
-
组内索引的第一个条目
标签: python pandas dataframe group-by