【发布时间】:2018-01-14 01:37:11
【问题描述】:
我正在尝试根据亚马逊消费者对耐用型洗衣机、冰箱的评论将其实现为方面矿工。这个想法是输出方面而不是整个句子的情感极性。例如:“食物很好,但服务很差”评论必须输出食物是积极的,服务是消极的。我阅读了 Richard Socher 关于 RNTN 模型的细粒度情感分类器的论文,但我想我需要为不同领域的短语手动标记情感,并创建自己的树库以提高准确性。
这是我想到的另一种方法。有人可以用您的反馈验证/指导我吗 将方法分解为 2 个子任务。 1) 识别方面 2) 识别情绪
识别方面
- 使用词性标注器识别所有名词。这应该入围 可能在评论的所有方面。
- 使用这些名词的 word2vec 来确定相似名词并减少数据集大小
识别情绪
- 针对评分为 1、2、4、5 的评论训练 CNN 或密集网络模型(忽略 3 因为我们需要有极性的数据)
- 将测试集评论分解成短语(例如“食物很好”),然后使用上述模型对它们进行评分
- 找到第一个子任务中确定的方面并将它们标记为 他们各自的短语。
【问题讨论】:
标签: nlp stanford-nlp sentiment-analysis