【发布时间】:2020-01-31 11:20:03
【问题描述】:
我正在尝试使用 Python 计算数据框中对象变量的长度。我的很多变量都是带有缺失值的字符串,不幸的是,当我尝试计算缺失值的长度时,它显示为 3(因为它将“Nan”计为 3 个字符的值)。
这是我正在使用的代码:
df_string_mean_with_na = pd.DataFrame(df_string.applymap(len).astype(int).mean().to_dict(), index=[df_string.index.values[0]])
其中 df_string 是我的起始数据框,我正在尝试计算每列值的平均长度。 我想把对象变量的缺失值长度计为0,有没有办法?
【问题讨论】:
-
在这种情况下 Nan 是一个字符串吗?你可以用空的空间来代替它吗? df.replace('南','')
-
是的,这行得通!
标签: python pandas numpy count string-length