【发布时间】:2016-09-28 16:34:52
【问题描述】:
我有一个数据框,我想对其进行一些统计测试。但是,我想先根据其中一列对数据进行分组。
这是一个示例数据框:
CATEGORY ITEM SHOP1 STOCK SHOP2 STOCK
Fruit Orange 5 9
Fruit Apple 12 32
Fruit Pear 17 6
Veg Carrots 59 72
Veg Potatoes 6 57
Veg Courgette 43 22
Veg Parsnips 5 9
... ... ... ...
因此,对于这个示例,我想查看卡方分布但跨类别 - 所以我想将数据简化为如下表格:
SHOP1 SHOP2
FRUIT 34 47
VEG 113 160
表格显示每个商店每个类别的库存总和(这是一个非常简化的版本 - 我的数据运行到 37 个类别超过几百行),不再指定项目,只是类别。
所以我想我可以group_by(CATEGORY) 然后对分组数据运行卡方检验,但这似乎不起作用。我想我需要将带有数字的两列相加,但我不知道如何结合卡方检验来做到这一点。我已经有一段时间没有运气了,所以我非常感谢您的帮助!
【问题讨论】:
-
我没有丰富的经验,但也许
purrr包可能会有所帮助。 -
您是否厌倦了 summarise() 函数中的卡方检验?
group_by(x)%>%summarise(...