【发布时间】:2016-04-13 16:20:42
【问题描述】:
我有 200 多个 CSV 文件。每个文件有 150 多列和 1000 多行。每个文件都以产品名称命名。 每个文件为数据集提供不同列中不同类别的不同项目的标志。其中一列是该类别中每个项目的总使用量。以下是数据集的示例:
Values A B C
1 Y
2 Y
3 Y Y
4 Y
我昨天问了一个问题,我收到了有关如何获得以下结果的帮助。
Count Sum
A 2 4
B 1 2
C 2 7
基本上,我希望计数列给我 A、B 和 C 的“y”数,而 Sum 列给我每次在 A 列中有一个“Y”时使用列中的总和、B、C
现在我对第 2 步有疑问 - 我已将所有文件放入一个文件夹中。我想做的是使用上述结果,将其应用到每个文件中,然后将答案按文件和类别分组。例如
File 1 Count A Sum A Count B Sum B Count C Sum C
File 2 Count A Sum A Count B Sum B Count C Sum C and so on.
如何在 R 中做到这一点?我搜索了论坛,发现循环很有帮助,但我不确定如何将结果合并为一个。
【问题讨论】:
标签: r