【问题标题】:What is search.twitter.com's "trending topics" algorithm?什么是 search.twitter.com 的“热门话题”算法?
【发布时间】:2010-09-13 17:08:11
【问题描述】:

twitter 使用什么算法来确定您可以在search.twitter.com 看到的 10 个主题?我想实现该算法,我还想展示 50 个最受欢迎的主题(而不是 10 个)。你能描述一下最有效的算法吗?

谢谢!

(Twitters API 可以在-http://apiwiki.twitter.com/REST%20API%20Documentation找到)

另外,我希望能够通过搜索公共时间线来实现该算法-http://twitter.com/statuses/public_timeline.rss

【问题讨论】:

    标签: algorithm search twitter trending


    【解决方案1】:

    Twitter 的趋势算法不仅仅是关键字的数量。这是其中的一部分,但还有一个衰减因素,因此“贾斯汀·比伯”不会永远成为热门趋势。

    quora 上的这篇文章支持了这一点。 http://www.quora.com/Trending-Topics-Twitter/What-is-the-basis-of-Twitters-current-Trending-Topics-algorithm?q=trending+algorithm

    衰减通常是通过在算法中使用帖子的相对年龄来完成的,给较新的主题/帖子/等更多的权重。

    另见http://www.quora.com/What-tools-algorithms-or-data-structures-would-you-use-to-build-a-Trending-Topics-algorithm-for-a-high-velocity-stream?q=trending+algorithm

    【讨论】:

      【解决方案2】:

      所以 Twitter 可能做的是计算特定术语的提及次数减去停用词(停用词,例如:do、me、you、i、not、on 等) 所以“the cat is out of the bag”和“my dog ate my cat”意味着 cat ,dog 和 bag 将是它提取的术语(其余都是停用词) 然后它将“猫”计为 2 个引用,因此在这种情况下,“猫”将是一个热门话题。

      【讨论】:

        猜你喜欢
        • 2010-10-21
        • 1970-01-01
        • 2012-01-25
        • 1970-01-01
        • 2015-03-08
        • 2015-09-10
        • 2017-03-11
        • 1970-01-01
        • 2017-10-07
        相关资源
        最近更新 更多