【发布时间】:2015-01-13 02:37:04
【问题描述】:
寻找有关决定推文(实际上是一个字符串)是否传达危险情绪的 API、方法、研究等。
例如:
危险:“街对面的房子着火了!!
不危险:“这个女孩着火了!喜欢这首歌”
【问题讨论】:
标签: machine-learning nlp sentiment-analysis
寻找有关决定推文(实际上是一个字符串)是否传达危险情绪的 API、方法、研究等。
例如:
危险:“街对面的房子着火了!!
不危险:“这个女孩着火了!喜欢这首歌”
【问题讨论】:
标签: machine-learning nlp sentiment-analysis
关于检测危险的特定问题的研究很少,但是有一些研究论文描述了检测自然灾害的方法。您的示例让人想起其中之一的标题:Finding Fires with Twitter。您可能会发现另一项有用的研究是Emergency Situation Awareness: Twitter Case Studies。
然而,一般来说,解决此类问题的最佳方法是通过监督分类,这与情感分析的方式非常相似(或者更确切地说,因为现在有更复杂的机器学习范例,如 Deep Learning 正在应用)完成。
本质是将文档(在您的情况下为推文)标记为“危险”和“非危险”。这个标签是由人类专家完成的。理想情况下,他们应该精通语言和领域。因此,使用知道 Twitter 口语的以英语为母语的人将是完成这项任务的完美注释者。
一旦标记了足够数量的文档,基线(即基本方法)通常通过创建 n-gram 词向量作为特征向量并运行 SVM 来实现。如果您不了解机器学习的详细信息,请在执行此操作之前阅读它们。
【讨论】: