【发布时间】:2012-10-09 10:33:03
【问题描述】:
我刚刚启动 Solr 并使用 ExtractingRequestHandler 使用 curl 命令索引 PDF 文件:
curl "http://localhost:8983/solr/update/extract?literal.id=doc1&commit=true" -F "myfile=@file.pdf"
我使用 Solarium 作为 Solr 客户端来查询和列出结果。
但是,只要用户不知道他正在搜索的单词来自哪个文件,所有这些步骤仍然是无用的。
所以我只想显示文件中关键字所在的部分文本,以及下载文件的链接。
任何帮助将不胜感激。
【问题讨论】:
-
嗯,找到的一种解决方案是将文件名传递给文字属性。我有数百个文件。我需要遍历所有文件,并且对于每次迭代,我获取文件名并将其传递给 curl 命令。我认为我应该在 bash 文件中执行此操作,任何人都可以帮助我,因为我对此一无所知。
-
是的,您需要将文件作为单独的文档进行迭代和上传。然后可以突出显示这些内容。