【问题标题】:Full-text personalized search product全文个性化搜索产品
【发布时间】:2011-10-22 14:47:44
【问题描述】:

有哪些全文搜索技术支持全文个性化搜索?

例如,在您选择的网络邮件提供商中搜索联系人:它是全文,但只搜索您的个人联系人,而不是整个联系人。

那里有无数的全文搜索包,但我不知道如何使用大多数全文搜索包,这样每个用户只能看到文档世界的一小部分。

【问题讨论】:

  • Google 个性化搜索可以做到这一点,不是吗?我不知道你可以让它潜伏在你的系统上并与你所有的帐户和东西交互的产品。我猜你可以用 lucene 和你的浏览器插件来写这样的东西?

标签: search full-text-search nlp information-retrieval


【解决方案1】:

我建议使用特殊字段(如contact_list_id、usage_freuency)为所有联系人构建lucene 索引。在搜索每个用户时添加他们的特定参数,即 text:"John smith" AND contact_list_id:"$current_user_id" order by usege_freuency。在这种情况下,您将优化索引所有压缩在一个地方的数据,并且它还通过诸如 usage_freuency 或更强大的排名之类的字段进行个性化。将索引视为具有高效文本搜索的数据库。

【讨论】:

    【解决方案2】:

    就电子邮件而言,这很简单:使用任何流行的搜索工具包并为每个用户建立一个索引。这很简单,因为索引不应重叠,否则您将侵犯用户的隐私。此外,重叠可能会扭曲像 IDF 这样的数字。 (您可能很想只索引一次发送给多个用户的电子邮件,但这样做的安全性和隐私影响是不值得的。磁盘很便宜。)

    如果通用文档集合应该被索引以进行个性化搜索,恐怕你只能靠自己了。

    【讨论】:

      猜你喜欢
      • 2013-10-19
      • 2019-12-19
      • 2013-03-12
      • 2017-08-23
      • 2014-08-26
      • 1970-01-01
      • 1970-01-01
      • 2012-03-28
      • 1970-01-01
      相关资源
      最近更新 更多