【问题标题】:Detecting danger in tweets [closed]在推文中检测危险[关闭]
【发布时间】:2015-01-13 02:37:04
【问题描述】:

寻找有关决定推文(实际上是一个字符串)是否传达危险情绪的 API、方法、研究等。

例如:

  • 危险:“街对面的房子着火了!!

  • 不危险:“这个女孩着火了!喜欢这首歌”

【问题讨论】:

    标签: machine-learning nlp sentiment-analysis


    【解决方案1】:

    关于检测危险的特定问题的研究很少,但是有一些研究论文描述了检测自然灾害的方法。您的示例让人想起其中之一的标题:Finding Fires with Twitter。您可能会发现另一项有用的研究是Emergency Situation Awareness: Twitter Case Studies

    然而,一般来说,解决此类问题的最佳方法是通过监督分类,这与情感分析的方式非常相似(或者更确切地说,因为现在有更复杂的机器学习范例,如 Deep Learning 正在应用)完成。

    本质是将文档(在您的情况下为推文)标记为“危险”和“非危险”。这个标签是由人类专家完成的。理想情况下,他们应该精通语言和领域。因此,使用知道 Twitter 口语的以英语为母语的人将是完成这项任务的完美注释者。

    一旦标记了足够数量的文档,基线(即基本方法)通常通过创建 n-gram 词向量作为特征向量并运行 SVM 来实现。如果您不了解机器学习的详细信息,请在执行此操作之前阅读它们。

    【讨论】:

    • 花了几个小时下载推文并手动对其进行分类......现在我正在使用朴素贝叶斯分类器,它似乎工作得很好!
    猜你喜欢
    • 2011-03-30
    • 1970-01-01
    • 2011-03-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多