【发布时间】:2017-12-11 03:20:26
【问题描述】:
某些类型的数据集是否不能预测?
我自己当前的现实生活示例:我的目标是创建一个用于交叉销售保险产品的预测模型。例如。从汽车保险到健康保险。
我的数据集主要由特征数据组成,例如他们居住的州、年龄、性别、汽车类型等......
我尝试了各种不同的模型,例如 XGboosted Trees 到正则化逻辑回归,而 AUC 不能超过 0.65。
所以这导致我 - 某些类型的数据集只是不能预测吗? 您如何帮助利益相关者理解这一点?
【问题讨论】:
-
理论观点:尝试预测随机数据(例如 0 类和 1 类)并优于随机猜测(50%)。你不能。
标签: machine-learning analytics data-analysis predictive