【问题标题】:Predict the probability of someone leaving based on two conditions根据两个条件预测某人离开的概率
【发布时间】:2019-07-08 09:04:40
【问题描述】:

我目前正在研究一个数据集,该数据集提供几年来有关一家大公司员工的信息。信息包括员工当年是否辞职(每年对或错),他们所处的税收等级以及他们的年龄。根据数据集,我绘制了戒烟者与其年龄的百分比,以及戒烟者与其税级的百分比。假设这些数字可以被视为某人在给定年龄的情况下退出的概率,以及某人在给定税级的情况下退出的概率,我想找到一种方法来预测某人在给定年龄和税级的情况下退出的概率。

我不能为此使用我们的数据集,因为它太小而且大多数组合都不会出现在其中(所以我只是得到 0% 的所有内容)。有没有办法使用某种模型来预测它?

【问题讨论】:

  • 这听起来像是一道数学题,与python本身无关
  • 我投票结束这个问题作为题外话,因为这听起来像一个数学问题,可能属于数学堆栈交换

标签: python dataframe statistics probability


【解决方案1】:

一种直接而简单的方法是使用您从他们所在的年龄和税级中获得的百分比的平均值。缺点是您认为这两个变量是独立的,并且在决定是否员工会不会辞职。

更好的方法是使用分类器,根据员工的税级和年龄,更准确地预测员工离职的可能性。您可以从随机森林等常见分类器开始。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-04-29
    • 2018-10-29
    • 2016-05-23
    • 1970-01-01
    • 2019-09-16
    • 1970-01-01
    相关资源
    最近更新 更多