【问题标题】:How does Twitter determine the spelling of trending hashtags?Twitter 如何确定热门话题标签的拼写?
【发布时间】:2017-08-27 11:24:37
【问题描述】:

我正在尝试为应用构建一个类似于 Twitter 主题标签的主题标签系统。但是,当将不同的拼写组合在一起时,我无法弄清楚如何拼写这些标签。

例如,当您在 Twitter 上使用 #abc 时,可能会有不同的拼写形式,例如 #abc、#Abc、#aBC 等。 当一个 hastag 成为趋势时,它会在趋势列表中以某种拼写形式显示,例如。 #abC 并对所有不同的版本进行分组。

我应该如何确定“正确”的拼写?

【问题讨论】:

  • 标签最多的主题标签可能被视为正确且不同的变体(与案例相关)只是将数字相加。不过我不确定。

标签: twitter hashtag


【解决方案1】:

我刚刚为我的应用程序构建了一个标签系统,但我还没有完全完成它,但我的方法是获取任何带有 #* 字符串的帖子。然后用

解析出来
GetHashes(t: string){    
var hashed = t.match(/#\w+/g);
if(hashed != null){
  hashed.forEach(element => {
    var unhashed = element.slice(0,0) + element.slice(1,element.length);
    this.hashTags.push(unhashed);
  });
}else{

}

}

然后,一旦我有了所有的哈希值,我就简单地做一个替换来把所有的东西都翻译成小写。这就是我发送到数据库的内容。我正在使用 Firebase,所以我对我的数据进行非规范化并大量复制,因此我将帖子的全部内容存储在数据库中的标签下。这可能看起来像很多数据存储浪费,但存储很便宜。然后我不必实现像“ElasticSearch”或“Algolia”这样昂贵的搜索系统。 (我仍然需要进行全文搜索,但不需要哈希,为我节省了大量现金)。

然后,当我想返回所有 #* 时,我只需在 Firebase 数据库和中提琴中找到该引用!

我想不通的是如何使我的主题标签链接动态调用函数。我一直在使用 innerHtml 但这使所有内容都成为字符串。

希望这会有所帮助。

【讨论】:

    猜你喜欢
    • 2010-11-15
    • 1970-01-01
    • 2020-04-11
    • 2015-03-08
    • 2015-09-10
    • 2013-05-24
    • 1970-01-01
    • 2017-10-07
    • 1970-01-01
    相关资源
    最近更新 更多