【问题标题】:Send multiple file into solr将多个文件发送到 solr
【发布时间】:2012-08-09 22:22:21
【问题描述】:

我想使用 curl 将多个文件发送到 solr。我该怎么做?

我只能用一个命令完成一个文件,例如:

卷曲 “http://localhost:8983/solr/update/extract?literal.id=paas2&commit=true” -F "file=@cloud.pdf"

任何人都可以帮助我,

Tks

【问题讨论】:

    标签: solr lucene indexing


    【解决方案1】:

    该 api 不支持传递多个文件进行提取。
    通常最后一个文件将是唯一被上传和添加的文件。

    您可以在 Solr 中将单个文件索引为单独的实体。

    或上传多个文件的一种方法是压缩这些文件并上传 zip 文件。
    Solr 索引 zip 文件存在一个问题,您可以尝试 SOLR-2332 补丁

    【讨论】:

    • 那么,如何索引静态文件夹,其中包含某些文件而不使用 curl 上传?有可能吗?
    • 不。使用 Solr,您必须上传文件。使用文件夹,您必须迭代并上传它。
    • 如果我有数千个文件,现在我有数千个文件用于索引,该怎么办?我应该一一上传吗?
    • 您可以轻松创建脚本来迭代和上传文件。因此,您不必手动进行。此外,这些文件将是 Solr 中的单个文档,而不是组合文档。
    • 让我们在indexing.osmosa.net/solr/browse 上检查我的 solr 我已经上传了数百个文件,使用 curl 命令,例如 :java -Durl=localhost:8906/solr/update/extract?literal.id=PPN -Dtype=text/html -jar post.jar *.htm 但是当我尝试用关键字PPN搜索,结果只显示一个文件。怎么样?
    【解决方案2】:

    我使用 apache solr 4.0 Beta,它能够上传多个文件并为使用 post.jar 上传的每个文件生成 id,这对我很有帮助。

    让我们拭目以待:

    http://wiki.apache.org/solr/ExtractingRequestHandler#SimplePostTool_.28post.jar.29

    谢谢大家:)

    我的问题已经解决了:)

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2014-04-06
      • 1970-01-01
      • 2019-03-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-04-12
      相关资源
      最近更新 更多