【发布时间】:2021-06-25 01:04:12
【问题描述】:
我正在研究一个有 35 列和 3047 行的基础。其中一列是“州”,它由美国的 50 个州组成,我想将这些州转换为数值,例如华盛顿是 1,西弗吉尼亚是 2,等等。
df.loc[df['State']=='Washington','State']=1
df.loc[df['State']=='West Virginia','State']=2
.
.
df.loc[df['State']=='Arizona','State']=50
df['State']=df['State'].astype(str).astype(int)
我收到此错误:ValueError: int() 的无效文字,基数为 10:'Washington'。 谁能帮我?我能做些什么来解决这个问题?你知道在 int 中转换 dtype 对象的其他方法吗? 提前致谢
【问题讨论】:
-
这能回答你的问题吗? How can I one hot encode in Python?
标签: python pandas database error-handling integer