【发布时间】:2019-07-28 17:13:39
【问题描述】:
对 rapidminer 和数据科学来说相当陌生。
我导入了数据(它非常广泛,所以需要一段时间来对所有数据类型进行分类)。我将数据放在随机森林中,它似乎强调了错误的事情。我相信这是由于不正确的数据类型分类。我似乎找不到好的数据类型文档,正在寻找有关 rapidminer 如何看待每个文档的解释。
例如,我有一些列有 90% 的空白,并且有几个填充了它。我将其标记为“名义上的”,并且快速矿工在此列中给予了很大的权重。我希望它更多地权衡日期列,因为我正在尝试预测周期 tmie.... 非常感谢任何帮助或见解!
一些可用的数据类型是:
标称
多项式
二项式
日期
正文
等等
【问题讨论】: