【发布时间】:2014-02-05 18:07:51
【问题描述】:
我被告知最好在适当的情况下对分类变量进行排序(例如,短小于中小于长)。我想知道,在将分类变量建模为解释变量的情况下,将分类变量视为有序变量而不是简单分类变量的具体优势是什么?它在数学上是什么意思(最好用通俗的话来说!)?
非常感谢!
【问题讨论】:
-
好问题 - 希望有人能够给出一个彻底的答案。部分原因与分类变量(R 中的
factors)如何用整数表示有关。所以c("Small", "Small", "Small", "Medium", "Large", "Large")将在内部表示为c(1,1,1,2,3,3)。
标签: r modeling categorical-data