【发布时间】:2017-07-31 21:05:28
【问题描述】:
我有一个带有 ID 号的大型数据框:
ID.head()
Out[64]:
0 4806105017087
1 4806105017087
2 4806105017087
3 4901295030089
4 4901295030089
目前这些都是字符串。
我想在不使用循环的情况下转换为int - 为此我使用ID.astype(int)。
问题是我的某些行包含无法转换为int 的脏数据,例如
ID[154382]
Out[58]: 'CN414149'
我如何(不使用循环)删除这些类型的事件,以便我可以安心使用astype?
【问题讨论】:
-
使用
pd.to_numeric(df['ID'], errors='coerce')将这些值转换为NaN,注意这将产生float的dtype,这个问题已经被问过无数次了 -
非常感谢!你为什么只评论;你回答正确,首先!无论如何,谢谢vm
-
因为问题描述通常不完整,所以它浪费时间发布答案,然后不得不编辑、询问更多信息、重新编辑等。而且这个问题看起来很简单,所以评论比肉体更快一个答案,除了我试图找到一个骗子
-
具有讽刺意味的是,这是目前谷歌搜索该问题的最高结果。