【发布时间】:2017-01-23 10:01:54
【问题描述】:
问题:我需要在每小时和每天之后在 Hbase 中插入一些用户 ID(例如:2201201711,这代表 2017 年 1 月 22 日:上午 11 点数据)。如果我想在某个日期或数据和时间范围内获取特定小时的所有用户 ID,那么表的设计应该是什么。
到目前为止我所做的,我将用户 ID 保留为行键,并在运行时在同一列族中创建列。 文件数据: 用户名 |约会时间 1 2201201711 2 2201201711 3 2201201711
我的 hbase 行键将是 1、2 和 3,并且将创建新列 2201201711。
我知道我可以使用使用日期、小时和用户 ID 的复合键。但我想了解它在性能方面提供了什么好处。
如果我选择一整列(没有任何过滤器)与使用复合行键查找,性能差异是什么。
【问题讨论】: