【发布时间】:2020-02-25 10:18:56
【问题描述】:
在训练数据中,我进行了特征工程并清理了我的数据。对测试数据做同样的事情重要吗? 我知道在测试数据中也需要一些基本的修改,如标签编码、依赖/独立特征分割等。但是我们真的需要在进行预测之前清理测试数据吗?
【问题讨论】:
-
你能说得更具体一点吗?我们在谈论什么类型的数据?清洁是什么意思?
-
清理意味着去除异常值、填充缺失值、规范化数据等
标签: python machine-learning data-science data-cleaning