【问题标题】:can we get probabilities the same way that we get them in logistic regression through random forest?我们能否像通过随机森林在逻辑回归中获得概率一样获得概率?
【发布时间】:2017-04-30 03:51:22
【问题描述】:

我有一个数据结构,其中包含二进制 0-1 变量(点击和购买;点击和不购买)针对属性向量。我使用逻辑回归来获得购买的概率。如何使用随机森林获得相同的概率?是通过使用随机森林回归吗?还是 R 中 type='prob' 的随机森林分类给出了分类变量的概率?

【问题讨论】:

  • “相同的概率”是什么意思? randomForest 分类器会为您提供概率,但与逻辑回归的值不同。您的数据有哪些维度?
  • 您使用的是哪个软件? ?水?其他的?

标签: r random-forest logistic-regression


【解决方案1】:

由于两种方法的结构不同,它不会给您相同的结果。逻辑回归由确定的线性规范给出,其中 RF 是来自多个独立/随机树的集体投票。如果对两者的规范和输入特征进行了适当的调整,它们可以产生可比较的结果。这是两者之间的主要区别:

  1. RF 将针对噪声、异常值、过度拟合或多重共线性等提供更稳健的拟合,这些都是回归类型解决方案中的常见缺陷。基本上,如果您对输入数据的内容不了解或不想了解太多,RF 是一个好的开始。

  2. 如果您熟悉数据以及如何正确指定方程,逻辑回归会很好。或者想以某种方式设计拟合/预测的工作方式。 GLM 规范的显式形式将允许您这样做。

【讨论】:

    猜你喜欢
    • 2016-06-01
    • 2018-02-19
    • 2021-12-04
    • 1970-01-01
    • 2016-01-28
    • 2015-05-04
    • 2013-12-24
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多