【问题标题】:Integrate Nutch with Solr For Advance Search Options将 Nutch 与 Solr 集成以实现高级搜索选项
【发布时间】:2012-02-15 07:56:44
【问题描述】:

我正在使用 apache-nutch-1.4apache-solr-3.2.0

我已成功将 NUTCHSOLR

集成

当我查询以下内容时

mysite/solr/select/?q=bone&version=2.2&start=0&rows=10&indent=on

它给了我以下结果

<doc>
<float name="boost">1.0117649</float>
<str name="cache">content</str>
<str name="content"></str>
<str name="digest">9bf016ea547cf50be81e468553c483de</str>
<str name="id">http://107.21.107.118:8000/</str>
<str name="segment">20120214151903</str>
<str name="title">Home</str>
<date name="tstamp">2012-02-14T10:19:08.215Z</date>
<str name="url">mysite:8000/</str>
</doc>

问题是当我必须搜索特定类别的骨骼时,例如 癌症结直肠和消化道

那么我需要在上面的查询中添加什么参数才能仅获取此特定类别的记录

mysite:8983/solr/select/?q=bone&????????

我有类似的网址

mysite:8000/Encyclopedia/Patient Centers/

mysite:8000/Encyclopedia/Patient Centers/Cancer/

mysite:8000/Encyclopedia/Patient Centers/Cancer/Colorectal & Digestive/

我的 schema.xml 文件看起来像这样,我也添加到 NUTCH 目录中......

http://dpaste.org/MTDF2/

我的声誉不是 10,所以我不能在这里制作任何附件,这就是为什么我需要将 schema.xml 粘贴到 dpaste.org...

对由此带来的不便深表歉意。

我会非常感谢您的意见和建议...

【问题讨论】:

    标签: solr nutch


    【解决方案1】:

    首先,您必须将 Cancer 和 Colorectal & Digestive 存储在类别字段中。您可以为此使用http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters#solr.PathHierarchyTokenizerFactory。然后 URL 可能类似于 mysite:8983/solr/select/?q=bone&fq=category:Cancer

    http://wiki.apache.org/solr/CommonQueryParameters#fq

    【讨论】:

      猜你喜欢
      • 2013-01-22
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-09-08
      • 1970-01-01
      • 2019-04-13
      相关资源
      最近更新 更多