【问题标题】:Sentiment Analysis java Library [closed]情绪分析java库[关闭]
【发布时间】:2015-01-12 23:32:58
【问题描述】:

我有一些未标记的微博帖子,我想创建一个情绪分析模块。

为此,我尝试了Stanford libraryAlchemy Api 网络服务,但结果不是很好。现在我不想训练我的分类器。

所以我想建议我一些图书馆或一些网络服务。我更喜欢经过测试的库。这篇文章的语言是英语。预处理也完成了。

附言

我使用的编程语言是Java EE

【问题讨论】:

  • 要求我们推荐或查找书籍、工具、软件库、教程或其他非现场资源的问题对于 Stack Overflow 来说是题外话,因为它们往往会吸引固执己见答案和垃圾邮件。相反,请描述问题以及迄今为止为解决该问题所做的工作。
  • P.S.微博数据(twitter?)通常很糟糕,难怪分析工具不能很好地工作。
  • @Anony-Mousse 也许你是对的。但是问题可能属于以下类别:“如果您的问题通常涵盖……程序员常用的软件工具,那么您来对地方提出问题了!”但如果我的问题真的超出主题,我想对此表示歉意。
  • P.S.我的数据包含来自新闻门户的一些推文和一些 cmets。在第二种情况下,使用好的工具,结果是可以接受的。
  • 您的问题不在于如何使用这样的库。如果它是一个实际的、特定的编程问题,那么它将是主题,并且不容易受到民意调查和个人意见(!)。请参阅下面的答案,了解这些天您真正可以从情绪分析中得到什么。 99% 的炒作,1% 的交付。很遗憾。从技术上讲,斯坦福可能是最好的之一(!)

标签: java machine-learning data-mining text-mining sentiment-analysis


【解决方案1】:

在这里检查 SentiStrength:http://sentistrength.wlv.ac.uk/

他们声称它适用于推文。

【讨论】:

    【解决方案2】:

    LingPipe 是一款免费(以及付费)的情绪分析工具。 http://alias-i.com/lingpipe/index.html

    主要特点包括:

    1. 情绪分析

    2. 命名实体识别

    3. 聚类

    4. 主题分类

    5. 语言识别

    【讨论】:

    • 感谢您的回答。但我正在寻找一种仅用于情绪分析的工具。此外,表明您是否尝试过此工具用于微博(推文)数据集也会很有帮助。
    • 我目前正在为电影评论进行 Twitter 情绪分析。但似乎斯坦福 NLPNOT 最适合。所以我正在尝试训练 NLP。顺便说一句,结果似乎与最初训练的分类器有负偏差!此外,斯坦福 NLP 是基于“句子”的。其中推文包含多个句子。我们还需要更正拼写。运气不好!
    【解决方案3】:

    情绪分析跟不上大肆宣传的承诺。

    参见例如

    情绪分析的悲伤状态
    2013 年 12 月 26 日,作者 Angela Hausman
    http://www.hausmanmarketingletter.com/sad-state-sentiment-analysis/

    最近的实验表明,情绪分析数据的准确度不如抛硬币(准确率为 50%)。如果您的品牌根据情绪分析做出战略决策,那真的很可怕。

    ...

    虽然这些工具可以准确预测 60% 到 80% 的话语,但当删除中性话语(80% 的话语)时,准确度下降得惊人。

    换句话说,每个人都在他们的基准上作弊,并且过度拟合(例如,推文有大​​量重复和接近重复 - 转发 - 如果你包括这些,你就高估了真实表现)

    【讨论】:

      【解决方案4】:

      如果你想要一个好的情感分析服务,又不想训练自己的分类器,那你就得花钱了。然而,值得一提的是,该领域并不存在完美的工具。没有工具可以保证分析中 100% 的准确性。

      话虽如此,几个月前我玩过Semantria/Lexalytics。他们有一个简单的 Java SDK,并且他们的情绪分析结果非常准确。

      【讨论】:

      • 感谢您的回答。我知道这个工具及其结果。但我想使用一种工具来保证他们分析的 70% -80 的准确性。你知道任何免费工具吗,因为我不知道我现在是否可以使用非免费工具?
      • 我认为没有免费的工具可以完成这项工作。几个月前,我对这些工具进行了研究,但我不记得找到满足您要求的工具。我相信你在这里只有两个选择。第一选择是为此付出代价。第二种选择是训练您自己的算法,例如使用 Google Predict 或 Mahout。
      • 好的,谢谢。第二步是训练我的算法。现在我必须使用一个工具。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-05-10
      • 2010-11-14
      • 2011-11-24
      • 2013-02-02
      • 2014-08-27
      • 2011-08-29
      相关资源
      最近更新 更多