【发布时间】:2015-04-01 18:50:45
【问题描述】:
我是新来的,对 R 和一般统计数据非常陌生。 我得到了一个简单的 100 万行 csv 格式的数据。有4列:说 Col1 - 位置 Col2 - 某人的名字 Col3 - 日期访问 COl4 - 访问时间
将其导入 R 时,它们被翻译为数据框,所有列都是字符(我使用 str() 来查找导入数据的结构,而 class() 这就是为什么我知道它是一个 data.frame。
如您所见,它们都不是数字,我希望能够进行一些汇总,例如按人、按天、按时间按地点计算访问次数,反之亦然。
我是否需要在 R 之外操作数据,例如导入 SQL 并在那里进行一些聚合,或者我可以在 R 中执行此操作吗?
我希望你能指引我正确的方向......非常感谢 佩迪
【问题讨论】:
-
您可以使用
table()函数按组获取计数。见?table -
查看
xtabs函数。如果您使用tapply或aggregate,则返回计数的标准方法是使用length。 @hadley(以及我认为的其他人)已经为插件包构建了count函数。