【问题标题】:Create indexes in solr on top of HBase在 HBase 之上的 solr 中创建索引
【发布时间】:2016-05-19 08:44:43
【问题描述】:

无论如何,我可以在 Solr 中创建索引以从 HBase 执行近乎实时的全文搜索。

我不想将整个文本存储在我的 solr 索引中。发"stored=false"

注意: - 请记住,我正在处理大型数据集并希望进行近乎实时的搜索。我们正在谈论 TB/PB 的数据。

更新

Cloudera Distribution : 5.4.x 与 Cloudera Search 组件一起使用。

Solr:4.10.x

HBase : 1.0.x

索引器服务:具有 cloudera morphlines 的 Lily HBase 索引器

Cloudera 上是否有任何其他 NRT Indexer 服务或框架可以代替 Lily。只是一个想法。

【问题讨论】:

  • 这个问题对 hbase solr 集成有深入的了解。它对其他人也有用。因此,我赞成它
  • 还使用 Lily 和 Morphline 在 Solr 中添加多值字段更新 stackoverflow.com/questions/37420800/…
  • 如果在 hbase 的非行键列中搜索是目标,那么 hbase 中的二级索引是否符合您的目的?你评估了吗?
  • @Mahesha999 :此处标记的解决方案是公认的答案。谢谢

标签: solr hbase cloudera inverted-index


【解决方案1】:

Cloudera: 请查看this articleHbase-Solr using Cloudera-search,它们描述了如何实现这一目标。如这些文章所述,请参见下面的屏幕截图。 Have a look at known issues with Cloudera Search

是的,您可以考虑 Morphlines。它们可用于近乎实时的应用程序以及批处理应用程序。

我对 hortonworks 平台以及如何实现这一点了解不多。

【讨论】:

    猜你喜欢
    • 2015-08-03
    • 2016-08-21
    • 2011-12-30
    • 1970-01-01
    • 2016-07-02
    • 1970-01-01
    • 2011-12-31
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多