【发布时间】:2014-01-22 18:22:01
【问题描述】:
最近,我正在研究将用户的search log/query log 存储到 HBase 表中的解决方案。
让我们简单的原始查询日志:
query timestamp req_cookie req_ip ...
数据访问模式:
- 扫描一个时间范围内的所有查询。
- 使用指定查询扫描所有搜索历史记录
我想出了以下行键设计:
<query>_<timestamp>
但是查询可能很长或者编码不同,把query直接放到rowkey里面是不明智的。
我正在寻求帮助以优化此架构,以前有人处理过这种情况吗?
【问题讨论】: