【发布时间】:2019-10-07 03:48:58
【问题描述】:
我有一个包含 n 个变量的数据框,这些变量的值都是因子。现在我想从这个数据框中选择 m 列 (m
我已经查过了,但我只发现了在选择特定列的情况下如何找到因子组合的频率。在我的情况下,可能有许多列组合,因为 m
这是我们的数据,所有变量都有因子值。
company <- data.frame("country" = c("USA", "China", 'France', "Germany"),
"category" = c("C-corp", "S-corp", "C-corp", "LLC"),
"Type" = c("Public", "Private", "Private", "Private"),
"Profit" = c("High", "High", "High", "Low"))
现在我想选择 2 列 (m = 2) 并找出所有可能选择的变量的因子组合的频率
在这种情况下,我可以有“country = USA & category = S-Corp”、“country = USA & category = C-Corp”、“country = China & category = LLC”。但我也可以选择其他列并设置“国家 = 美国 & 利润 = 低”、“国家 = 中国 & 类型 = 公共”。我想知道所有这些组合的频率
编辑:我的预期输出类似于
country = USA, category = C-corp freq 1
country = USA, category = S-corp freq 0
country = USA, category = LLC freq 0
country = China, category = LLC freq 0
country = France, category = C-corp freq 1
country = USA, type = Public freq 1
country = China, type = Public freq 0
Type = Private, Profit = High freq 2
Type = Public, category = LLC freq 0
category = Private, Profit = Low freq 1
如果我需要选择 2 列,我需要所有可能的列组合,顺序无关紧要
【问题讨论】: