【发布时间】:2019-04-01 13:44:52
【问题描述】:
我有一个形状为(596000, 58) 的训练数据,下图有一些特征与使用train.isnull().sum() 的特征/行中的“NAN”数量。
考虑到每个特征都具有同等重要性并且是分类值我应该删除列 cat6 和 cat8 吗?cat6 411792/596000 是 NaN,cat8 266928/596000 是 NaN。
有没有办法处理这种情况?还是我必须删除这两列?
输入[12]:train.isnull().sum()
输出[12]:
【问题讨论】:
标签: python pandas csv machine-learning nan