在推文中检测危险[关闭]答案

【问题标题】：Detecting danger in tweets [closed]在推文中检测危险[关闭]
【发布时间】：2015-01-13 02:37:04
【问题描述】：

寻找有关决定推文（实际上是一个字符串）是否传达危险情绪的 API、方法、研究等。

例如：

【问题讨论】：

【解决方案1】：

关于检测危险的特定问题的研究很少，但是有一些研究论文描述了检测自然灾害的方法。您的示例让人想起其中之一的标题：Finding Fires with Twitter。您可能会发现另一项有用的研究是Emergency Situation Awareness: Twitter Case Studies。

然而，一般来说，解决此类问题的最佳方法是通过监督分类，这与情感分析的方式非常相似（或者更确切地说，因为现在有更复杂的机器学习范例，如 Deep Learning 正在应用）完成。

本质是将文档（在您的情况下为推文）标记为“危险”和“非危险”。这个标签是由人类专家完成的。理想情况下，他们应该精通语言和领域。因此，使用知道 Twitter 口语的以英语为母语的人将是完成这项任务的完美注释者。

一旦标记了足够数量的文档，基线（即基本方法）通常通过创建 n-gram 词向量作为特征向量并运行 SVM 来实现。如果您不了解机器学习的详细信息，请在执行此操作之前阅读它们。

【讨论】：