【问题标题】:Hbase column indexingHbase 列索引
【发布时间】:2014-04-15 22:59:49
【问题描述】:

我在 Cloudera 集群中运行的 hbase 实例中有一些列。

我有一列包含未规范化的电话号码(比如说 phoneNum)(它们来自联络中心呼叫,带有许多前缀、#s 和 *s。例如 *107*065777113512#)。

我需要查询数据库以找到特定的电话号码(不带选项),因此它将是 phoneNum 中某些记录的子字符串。

问题如下:

如何索引 hbase 以获得良好的性能并避免全扫描?

我阅读了有关 solr integration、lucene、lily 的信息,但我不知道它们中的任何一个是否适用于这个问题。

提前致谢!

【问题讨论】:

    标签: solr indexing hbase cloudera


    【解决方案1】:

    HBase 在列上没有索引。它纯粹由键索引。您可以使用规范化的电话号码作为键创建第二个表,然后使用列值链接回原始表,但这都是手动的,不会随着原始表的更改而更新。

    【讨论】:

      【解决方案2】:

      您正在寻找一些能够进行 substring 搜索的解决方案。您可以使用 Solr 实现。

      Solr 为您提供免费的文本搜索。您可以在 Solr 中找到许多 HBase 无法提供的搜索优势。首先查看https://wiki.apache.org/solr/

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2015-09-17
        • 2012-06-10
        • 2019-08-23
        • 1970-01-01
        • 2016-08-21
        • 1970-01-01
        • 2014-06-06
        • 2016-07-02
        相关资源
        最近更新 更多