【发布时间】:2016-05-19 08:44:43
【问题描述】:
无论如何,我可以在 Solr 中创建索引以从 HBase 执行近乎实时的全文搜索。
我不想将整个文本存储在我的 solr 索引中。发"stored=false"
注意: - 请记住,我正在处理大型数据集并希望进行近乎实时的搜索。我们正在谈论 TB/PB 的数据。
更新
Cloudera Distribution : 5.4.x 与 Cloudera Search 组件一起使用。
Solr:4.10.x
HBase : 1.0.x
索引器服务:具有 cloudera morphlines 的 Lily HBase 索引器
在 Cloudera 上是否有任何其他 NRT Indexer 服务或框架可以代替 Lily。只是一个想法。
【问题讨论】:
-
这个问题对 hbase solr 集成有深入的了解。它对其他人也有用。因此,我赞成它
-
还使用 Lily 和 Morphline 在 Solr 中添加多值字段更新 stackoverflow.com/questions/37420800/…
-
如果在 hbase 的非行键列中搜索是目标,那么 hbase 中的二级索引是否符合您的目的?你评估了吗?
-
@Mahesha999 :此处标记的解决方案是公认的答案。谢谢
标签: solr hbase cloudera inverted-index