【问题标题】:Find similar strings in postgresql hosted on Heroku在 Heroku 上托管的 postgresql 中查找类似的字符串
【发布时间】:2010-08-19 09:55:44
【问题描述】:

给定一篇文章的标题,我想仅根据标题在我的博客中找到所有类似的文章。

你会怎么做?

(我使用 postgresql 和 heroku)

【问题讨论】:

    标签: ruby-on-rails postgresql heroku


    【解决方案1】:

    使用 Websolr 完整测试搜索 heroku 插件,并使用太阳黑子搜索引擎。这样您就可以使用全文搜索,它会为您完成所有单词的搜索。

    http://addons.heroku.com/websolr

    http://outoftime.github.com/sunspot/

    【讨论】:

    • 具体来说,你想要 Solr 的 MoreLikeThis 功能。
    【解决方案2】:

    你可以这样做:

    title = "existing article title"
    @articles = Article.find(:conditions => ["title LIKE ?", "%#{title}%"])
    

    对于 Rails 3,它将是:

    title = "existing article title"
    @articles = Article.where(["title LIKE ?", "%#{title}%"])
    

    【讨论】:

    • 不幸的是,这并没有发现“如何在 Wordpress 中安装新插件”和“为什么 wordpress 完全摇滚!”之间的相似之处
    • 您并没有在原始问题中真正指定这一点。
    【解决方案3】:

    从您上次的评论来看,您在这里针对的是一个非常复杂的问题。你可以去here看看斯坦福自然语言处理小组的一个项目,它试图识别句子的名词、形容词、动词等。我将首先识别您帖子标题中的名词,然后在数据库中搜索这些名词。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2012-06-30
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-11-09
      • 2017-05-15
      相关资源
      最近更新 更多