【问题标题】:R - Streamlined Markov ChainR - 流线型马尔可夫链
【发布时间】:2018-02-14 08:58:28
【问题描述】:

我有两个数据集,年度转换概率和初始值。我们的目标是利用这些来了解公司在五年内会是什么样子。

初始值的格式为:

|     Age       |      Gender    |     Initial     |
----------------------------------------------------
|  18           | F              |  30             |
|  19           | M              |  35             |
|  20           | F              |  40             |
...             |                |
|  Out          |                |  400            |

初始值包含有关未来招聘的数据。这个数字可以根据解决方案的需要进行修改,但目前它代表的是每年的招聘人数。

转移概率的形式

|   Age        |    Gender    |   Hire       |    Terminate    |
----------------------------------------------------------------
|   18         |    F         |   0.025      |    0.3          |     
|   18         |    M         |   0.03       |    0.1          |
|   19         |    F         |   0.01       |    0.4          |
...

也就是说,所有招聘的 2.5% 将是 18 岁女性,所有 18 岁女性中有 30% 将离开公司。

使用马尔可夫转移概率我们有

p(Out, 18F) = 0.025
p(18F,Out) = 0.3
p(18F,19F) = 0.7 #The complement action to leaving the company is staying and getting a year older

假设没有性别变化或时间机器,所有其他转换概率将为 0。

有没有一种方法可以简化预测过程,这样我就不需要生成过渡矩阵,也不必大部分都为零?你会怎么做? (使用或不使用“markovchain”包)

PS:在我写这篇文章的时候,我意识到有两张表会更高效,一张给男性,一张给女性,分别计算它们,但这仍然不是我想要的。

【问题讨论】:

    标签: r optimization markov-chains


    【解决方案1】:

    后来解决了:最简单的方法是为每个年龄/性别组创建一个马尔可夫链,可以将其简化为一个数据框。

    初始值可以left_joined 到转移概率到数据结构d

    d$temp <- lag(d$Initial * d$Terminate)
    d$temp[1] <- 0 #Gets rid of NA
    d$temp <- d$temp + d$hire*TotHires[1]
    #where TotHires[1] represents the number hired in year 1
    

    这会给出一年后的结果。对于n 年,我们有

    d$temp <- d$Initial
    for (y in 1:n) {
      d$temp <- lag(d$temp * d$Terminate)
      d$temp[1] <- 0 #Gets rid of NA
      d$temp <- d$temp + d$hire*TotHires[n]
      #where TotHires[n] represents the number hired in year n
    }
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2015-11-15
      • 1970-01-01
      • 1970-01-01
      • 2015-11-10
      • 2017-05-15
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多