【发布时间】:2016-10-20 13:58:43
【问题描述】:
所以我有一个非常大的数据框,其中大部分是浮点数(从 csv 读取),但时不时地,我得到一个字符串或 nan
date load
0 2016-07-12 19:04:31.604999 0
...
10 2016-07-12 19:04:31.634999 nan
...
50 2016-07-12 19:04:31.664999 ".942.197"
...
我可以处理 nans(插值),但不知道如何使用 replace 来捕获字符串,而不是数字
df.replace(to_replace='^[a-zA-Z0-9_.-]*$',regex=True,value = float('nan'))
返回所有的nan。只有当它实际上是一个字符串时,我才想要 nans
【问题讨论】:
-
你能发一个“奇怪的东西”的例子吗
-
字符串是我遇到的唯一问题,从我的问题中删除了“奇怪的东西”。
标签: python pandas data-cleaning