【问题标题】:Probability in R data framesR数据帧中的概率
【发布时间】:2018-03-16 23:51:37
【问题描述】:

我正在使用朴素贝叶斯解决更大的概率问题,但现在我被困在如何解决问题的一小部分。这是我正在处理的 df 示例。

d = data.frame(work=c("unemployed","govt worker", "teacher", "unemployed"),
               race=c("white","black", "white", "white"),
               sex=c("male","female", "female", "male"))
> d
         work  race    sex
1  unemployed white   male
2 govt worker black female
3     teacher white female
4  unemployed white   male

我试图回答的问题是: 白人男性失业的概率是多少?

我认为第一步是建立一个可能性表,但我不知道如何去创建一个。

知道如何解决这个问题吗? 谢谢。

【问题讨论】:

  • table(d)/sum(table(d))

标签: r probability


【解决方案1】:

这行得通:

# set (equal) probability for each row
d$prob <- 1/nrow(d)

# group by race and sex, sum probabilities
d <- aggregate(prob ~ race + sex, d, sum)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-06-27
    • 1970-01-01
    • 2020-08-17
    • 2018-10-27
    • 2014-12-23
    • 2022-01-14
    相关资源
    最近更新 更多