【发布时间】:2018-11-20 16:15:35
【问题描述】:
我有一个包含 10000 行和 33 列的大型 pandas 数据框。 其中一列是“Age”,它具有数据类型“int64”和大量缺失值。
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10000 entries, 0 to 9999
Data columns (total 33 columns):
customer 10000 non-null int64
age 10000 non-null int64
缺失值已在数据中记录为 0。缺失值:
df['customer'][df[' age']==0].count()
>2942
我正在尝试用中值替换所有这些 0:
df[' age'].replace(to_replace=0, value = df[' age'].median, inplace = True)
这似乎运行良好。但是它将列的数据类型更改为O:
df[' age'].dtype
>dtype('O')
出了什么问题?
【问题讨论】:
-
df[' age'].median()。pd.Series.median是一个方法,你必须调用它才能返回值。
标签: python pandas replace types median