【发布时间】:2009-08-17 16:25:56
【问题描述】:
我正在从事一个涉及监控大量 rss/atom 提要的项目。我想使用 hbase 进行数据存储,但在设计架构时遇到了一些问题。对于第一次迭代,我希望能够生成一个汇总的提要(所有提要中的最后 100 个帖子按时间倒序排列)。
目前我正在使用两个表:
Feeds: column families Content and Meta : raw feed stored in Content:raw
Urls: column families Content and Meta : raw post version store in Content:raw and the rest of the data found in RSS stored in Meta
我需要某种用于聚合提要的索引表。我应该如何构建它?对于这类应用,hbase 是不是一个不错的选择?
问题更新:是否有可能(在 hbase 中)设计一种可以有效回答如下查询的架构?
SELECT data FROM Urls ORDER BY date DESC LIMIT 100
【问题讨论】: