【发布时间】:2023-03-14 02:21:01
【问题描述】:
因此,当键在对应于 [value-tolerance, value+tolerance] 的范围内时,我想用字典中的字符串替换 Dataframe 列中的值。
例如使用这样的字典:
dict = {101.2:"A", 110:"A", 150:"B", 170:"C", 600:"A"}
如果“aa”列中的值或多或少的容差与字典中的键匹配,我想用相应的字符串值替换列中的值。
作为下面的示例,如果我将容差值设置为 0.5,我希望“aa”列中的值 101 与字典中的键 101.2 匹配,从而将值 101 更改为“A”以匹配“aa”列中的行”。
这里是一个例子:
end start diff aa
0 200 99 101 101
1 250 99 151 151
2 270 99 170.2 170.2
3 300 99 201 201
4 450 99 351 351
5 600 99 501 501
6 800 99 701 701
7 250 200 50 50
8 270 200 70 70
9 300 200 100 100
10 450 200 250 250
11 600 200 400 400
12 800 200 600 600
13 270 250 20 20
14 300 250 50 50
15 450 250 200 200
16 600 250 350 350
17 800 250 550 550
18 300 270 30 30
19 450 270 180 180
20 600 270 330 330
21 800 270 530 530
22 450 300 150 150
23 600 300 300 300
24 800 300 500 500
25 600 450 150 150
26 800 450 350 350
27 800 600 200 200
从剪贴板加载数据帧
table = pd.read_clipboard().iloc[1:]
tol_value = 0.5
预期结果:
end start diff aa
0 200 99 101 A
1 250 99 151 151
2 270 99 170.2 C
3 300 99 201 201
4 450 99 351 351
5 600 99 501 501
6 800 99 701 701
7 250 200 50 50
8 270 200 70 70
9 300 200 100 100
10 450 200 250 250
11 600 200 400 400
12 800 200 600 600
13 270 250 20 20
14 300 250 50 50
15 450 250 200 200
16 600 250 350 350
17 800 250 550 550
18 300 270 30 30
19 450 270 180 180
20 600 270 330 330
21 800 270 530 530
22 450 300 150 B
23 600 300 300 300
24 800 300 500 500
25 600 450 150 B
26 800 450 350 350
27 800 600 200 200
我知道如何用完全匹配替换:
table2 = table.replace({"aa": dict})
但我不知道如何通过公差来做到这一点。
我试过了:
for index, row in table.iterrows():
for key, value in dict.iteritems():
if (row['aa']-tol_value <= key) & (key <= row['aa']+tol_value):
table.replace(row.aa, value)
它可以工作,但不幸的是,这会创建与迭代一样多的数据帧。
任何帮助将不胜感激
【问题讨论】:
标签: python pandas dictionary dataframe iteration