【发布时间】:2017-10-15 00:39:25
【问题描述】:
我正在尝试根据第一个、第三个和第四个分位数(即 0-25%、25%-75%、75%-100%)对 R 中的列中的数字数据进行分箱。我使用了以下代码,但零不包含在分箱中。它们显示为 NA。
rawdata1$usage4 <- cut(rawdata1$Usage_Percentage,
breaks = quantile(rawdata1$Usage_Percentage,
probs = c(-Inf,0.25,0.75,Inf),include.lowest=T),labels=F)
quantile.default(rawdata1$Usage_Percentage, probs = c(-Inf, 0.25, : [0,1] 之外的“概率”
但是,如果使用以下代码并将其分为 4 个分位数,则 bin 就可以了。
rawdata1$usage5 <- cut(rawdata1$Usage_Percentage,
breaks = quantile(rawdata1$Usage_Percentage),
include.lowest=T,labels=F)
【问题讨论】:
-
你试过
probs = c(0,0.25,0.75,1),