【发布时间】:2020-07-15 13:44:36
【问题描述】:
我在构建模型的过程中陷入困境。基本上我有 10 个参数,所有这些参数都是分类变量,甚至类别都有大量唯一值(一个类别有 300 000 条记录的 1335 个唯一值),并且要预测的 y 值是天数(数值)。我正在使用随机森林回归器并获得大约 55-60% 的准确度。我不确定这是否是最大限制,或者我真的需要更改算法本身。我对任何类型的解决方案都很灵活。
【问题讨论】:
标签: python machine-learning regression data-science random-forest