【问题标题】:Nutch Keyword search cannot retrieve all the pages contain that keywordNutch 关键字搜索无法检索到包含该关键字的所有页面
【发布时间】:2013-06-20 02:04:35
【问题描述】:

我正在使用 Nutch 和 Lucene (java API) 进行网站关键字搜索。我的问题是 Nutch 无法分配包含所需关键字的所有页面。例如。我有一个名为“Luxury Bag”的产品,如果我用“Luxury”搜索,我不会在结果中找到该产品,如果我用“Luxury Bag”找到它。我为这个错误花了一个多星期的时间,完全不知道。另外,我用 Luke Program 测试了我的爬取数据。它与 Luke 完美搭配,但不适用于我的 java 代码。任何人都可以建议我。欢迎和赞赏任何建议。谢谢。

【问题讨论】:

    标签: java lucene nutch keyword-search


    【解决方案1】:

    我刚刚解决了这个问题。

    Query query = Query.parse(searchQuery, conf);
    QueryParams queryParams = new QueryParams();
    queryParams.setMaxHitsPerDup(100);
    queryParams.setNumHits(100);
    query.setParams(queryParams);
    Hits hits = bean.search(query);
    long allResultsCount =**hits.getTotal());**
    

    我把它改成了

    long allResultsCount =**hits.getLength());**
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-12-17
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-01-31
      • 2021-04-22
      相关资源
      最近更新 更多