【发布时间】:2020-10-19 14:40:53
【问题描述】:
我正在尝试使用以下函数替换 NAN 值,但出现索引超出范围错误。This 是我的示例数据框。它有列(日期、中心名称、商品名称、价格、年份)。我正在尝试使用基于相应年份和中心名称列的价格的 MODE() 替换价格列缺失值。
例如,对于 1997 年和 Centre_Name='SHIMLA',我使用下面的代码来替换 Price 列的缺失值并且它正在工作。
data.loc[(data['Year']==1997)&(data['Centre_Name']=='SHIMLA')&(data['Price'].isnull()),'Price']=data.loc[(data['Year']==1997)&(data['Centre_Name']=='SHIMLA'),'Price'].mode()[0]
但下面的功能不起作用。请帮助
year_list=list(data['Year'].unique())
for each_year in year_list:
city_list=list(data[data['Year']==each_year]['Centre_Name'].unique())
for each_city in city_list:
data.loc[(data['Year']==each_year)&(data['Centre_Name']==each_city)&(data['Price'].isnull()),'Price']=data.loc[(data['Year']==each_year)&(data['Centre_Name']==each_city),'Price'].mode()[0]
【问题讨论】:
标签: python pandas machine-learning data-analysis missing-data