【问题标题】:Using Ferret to build unique tag clouds使用 Ferret 构建独特的标签云
【发布时间】:2009-12-15 23:37:54
【问题描述】:

在我正在进行的一个小项目中,我一直使用 Ferret 作为我的全文搜索引擎。

通过在线文档和一些示例,我已经能够使用全文索引将标签云生成器组合在一起,以帮助使用IndexReader.terms 方法生成标签云。

到目前为止,当我想根据搜索结果获取术语数据时,它工作得很好。

例如,如果用户搜索“蛋糕”,我想向他们展示与“蛋糕”相关的术语标签云。

我一直在寻找 terms 方法可用于与搜索结果集或类似方法相关联的示例?

目前我正在使用以下方法来生成我的标签列表:

reader = Ferret::Index::IndexReader.new(Scrape.find_last_index_version)
terms = []
reader.terms(:all_quotes).each do |term, doc_freq|
    terms << [term, doc_freq]
end

干杯。

【问题讨论】:

    标签: ruby-on-rails tags ferret


    【解决方案1】:

    它更像是一个词频图表(像一个 wordle)而不是标签云?还是这些在标签字段中?无论如何,索引不会跟踪每个可能的文档子集中的词频(例如搜索结果),因此该方法不会很快,即使它存在。对于单个文档,您可以获得 TermFreqVector 并提供与该文档中的其他常用术语很好匹配的建议文档。因此,您可以获取一些最重要的结果,从每个结果中获取术语向量,然后将它们相加,但这些聚合函数本身并不存在(它们通常会尽量不将缓慢的操作放入其中。)

    【讨论】:

      猜你喜欢
      • 2011-11-11
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-07-19
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多