【发布时间】:2020-04-22 08:14:29
【问题描述】:
拥有如下数据框(实际数据框包含多个字符串和数字列):
col1 col2
0 A 10
1 A 10
2 B 5
3 B 5
我想根据列值对数据进行规范化,因此结果如下所示:
col1 col2
0 A 0.632456
1 A 0.632456
2 B 0.316228
3 B 0.316228
然后将其分成组得到:
col1 col2
0 A 0.632456
1 A 0.632456
col1 col2
0 B 0.316228
1 B 0.316228
分组很容易,但我正在努力实现标准化。我试过使用以下代码:
from keras.utils import normalize
df = pd.DataFrame({"col1":["A","A","B","B"],"col2":[10,10,5,5]})
normalize(df, axis=0)
但由于我有字符串,它会失败,如果 A 和 B 的值是数字,它会起作用。
问:如何在不删除字符串列的情况下按列对数值进行规范化,以便以后可以分组?
【问题讨论】: