【问题标题】:Best way to integrate solr with any data source将 solr 与任何数据源集成的最佳方式
【发布时间】:2018-06-03 02:40:40
【问题描述】:

我正在将我的旧索引工具迁移到 solr(版本 7)。但我不太确定,如何将我的文件索引到 solr。

我们系统中的数据位于 oracle DB、mysql 和 cassendra。但是这些数据库中的更新并不那么频繁(24 小时内 2-3 次),这些将是我的 solr 索引文件的来源。

在其中一个集合中,我将有大约 300k-400k 条记录,而在另一个集合中大约有 5k。

我可以想出两种方法。

  1. 使用 apache Storm 从差异数据源创建 ETL 管道。
  2. 使用 Kafka 连接源和接收器。

2 中哪一个对我们这样的系统有好处?或者对于我们这样的系统来说,这两种方法都是矫枉过正的?

【问题讨论】:

  • Nifi 或 Streamsets 可能比手动编写 Storm 拓扑更好,而且这些数据库与 Kafka Connect 有重叠

标签: solr apache-kafka apache-storm


【解决方案1】:

数据的大小足够小,可以随心所欲地做任何事情 - 使用现有工具或用您熟悉的语言编写小型索引器。在那个阶段没有必要过度考虑这一点。

除此之外,如果没有深入了解您的情况,通常不可能提出建议,除非是非常具体的问题。

【讨论】:

    猜你喜欢
    • 2010-10-24
    • 1970-01-01
    • 1970-01-01
    • 2011-09-12
    • 2010-10-08
    • 2010-11-26
    • 2020-10-01
    • 2012-10-21
    • 2012-03-15
    相关资源
    最近更新 更多