【问题标题】:Apache Solr core per file每个文件的 Apache Solr 核心
【发布时间】:2013-05-19 03:13:30
【问题描述】:

我正在上传许多 csv 文件

currency.csv 文件:

code,currency_name,currency_decimals
AUD,Australian Dollar,2
GBP,Pound Sterling,2
...
...

currency_holidays.csv 文件:

code,holiday_date,holiday_name
AUD,02/01/2012,New Year's Day Observed
AUD,26/01/2012,Australia Day
...
...

注意:在 solr 配置文件中 uniqueKey 设置为“code”

  1. 如果我将这些文件上传到 solr 单核,它将覆盖匹配的货币记录,例如澳元。对吧?

  2. 每个文件都有核心更好吗?即多核。

这是我之前的帖子:

apache solr csv file same values

什么是最好的解决方案?我需要帮助。希望有人能帮忙。

谢谢 通用汽车

【问题讨论】:

标签: solr lucene solrcloud


【解决方案1】:

您可能需要考虑的一些要点:-

  1. 如果您有完全不同的实体,它们没有任何共同之处,也没有依赖关系(没有连接),最好将它们作为单独的核心。
  2. 这将是一种更简洁的方法。
  3. 因为可能存在具有通用名称并且需要以不同方式进行分析的字段以及
  4. 搜索以不同方式表现字段及其提升
  5. 如果数据量很大,这也是可以管理的。

但是,如果您有一个非常小的数据集,而上述任何一项都与您无关,那么您只需使用一个核心即可。
您可以使用唯一键为 id 添加前缀,例如curreny_aud 和 holiday_aud 这将帮助您保持实体分离并防止覆盖。

【讨论】:

  • Jayendra,感谢您的重播。现在我将使用不同的内核。我最初确实考虑过 curreny_aud 和 holiday_aud 可能是替代方案。再次感谢。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2018-03-19
  • 1970-01-01
相关资源
最近更新 更多