【问题标题】:Solr admin shows number of indexes(numDocs) to be greater than the number of files I processedSolr 管理员显示索引数(numDocs)大于我处理的文件数
【发布时间】:2014-10-13 15:38:05
【问题描述】:

当我使用 Solr 处理 56 个文件时,它会显示“numDoc:74”。我不知道为什么存在比处理的文件更多的索引,但我想出的一个解释是几个处理过的文件的索引太大,所以它们被分成多个索引(我使用丰富的内容提取所有已处理的文件)。这只是一个想法,所以我不想一开始就认为它是真的。谁能给出替代解释或确认这一点?

使用 Django + Haystack + Solr。

非常感谢

【问题讨论】:

  • 你能发布你的search.py模块吗?
  • 你的意思是 haystack 的 search_indexes.py?

标签: django solr indexing django-haystack


【解决方案1】:

很遗憾,您的术语完全不正确,但故障排除过程应该足够简单。 Solr 带有管理控制台。通常在 http:// [ localhost 或 domain ]:8983/solr/ 。去那里,在下拉列表中找到你的集合(我假设 Solr 4)并在查询屏幕中运行默认查询。这应该会给你所有的文件,你可以看到额外的东西是什么。

我怀疑您的唯一 ID 和/或重新索引可能存在一些问题。但是使用少量文档,您实际上可以查看您在 Solr 中实际存储的内容并找出不正确的内容。

【讨论】:

  • 好的,谢谢!生病检查一下。我的术语有什么特别错误?我想知道,所以我可以修复它。
  • 我不知道您在该消息中所说的“索引”是什么意思。 Solr 具有包含由字段(和嵌套文档)组成的文档的集合。有“索引”(以及分片和其他东西),但更多的是技术层面的讨论。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-06-04
  • 1970-01-01
  • 2018-06-15
  • 2015-12-05
  • 2012-04-20
  • 2012-04-21
相关资源
最近更新 更多