【问题标题】:Sentiment analysis for waiting times in hospitals医院等待时间的情绪分析
【发布时间】:2020-03-29 15:26:01
【问题描述】:

我一直试图从患者在医院的评论中推断出及时性评分(基于患者等待时间的评分)。可用的数据是患者的评论和他们对整体体验的评分。问题是我没有为患者及时评分的标签,而是对整个体验的评分。 诸如“我已经等了很长时间,但这次经历是值得的”之类的评论具有良好的背景和良好的评级,应该会返回一个有点糟糕的及时性分数,同样的事情对于“等待时间很短,但它并不能证明不好是合理的”服务'。因此,撰写评论的人的背景/感觉也很重要。 我已经清理了评论并提取了与等待时间相关的部分句子(如果存在),并使用 TextBlob 或 VaderSentiment 等库来推断患者的情绪是否积极。问题是我有 20% 的情况是我从不同的库中获得了不同的结果,而且它们并不总是最有意义(等待时间长但在良好背景下的评论会返回良好的等待时间,但它应该在至少保持中立)。 我需要某种方式,我可以将句子的上下文和实际评分与他们等待的时间相关联并得出一个分数,这是一种考虑到整个句子但寻找特定的情绪分析讨论等待时间的上下文。

【问题讨论】:

    标签: python machine-learning nlp unsupervised-learning


    【解决方案1】:

    您的问题称为“基于方面的情感分析”。我不是这方面的专家,但也许这个博客可以让你开始 - monkeylearn.com/blog/aspect-based-sentiment-analysis

    【讨论】:

      【解决方案2】:

      一个有用的解决方案是:

      1. 在给定的语料库中应用 语义角色标签 以找到您的突出显示的特征
      2. 使用带有负采样的 Word2Vec-SkipGram 等词嵌入技术

        (想法:相同的词出现在相同的上下文中,所以 它不需要重新计算相似度。)

      3. 通过包围的词(窗口大小)找到特征的情绪。

        注意:使用 SentiWordNet 之类的 Sentiment 词典可能会有所帮助 你。

      4. 定义一种获取整体方面级别(突出显示的特征)情感分析的方法。

        例如在二进制分类中:
        pos/neg极性的聚合除以句子中的特征数量

      5. 训练你的模型

      【讨论】:

        猜你喜欢
        • 2019-05-06
        • 2013-02-02
        • 2014-05-16
        • 2014-12-11
        • 1970-01-01
        • 1970-01-01
        • 2017-11-06
        • 1970-01-01
        • 2011-05-10
        相关资源
        最近更新 更多