【问题标题】:NLP Aspect Mining approachNLP 方面挖掘方法
【发布时间】:2018-01-14 01:37:11
【问题描述】:

我正在尝试根据亚马逊消费者对耐用型洗衣机、冰箱的评论将其实现为方面矿工。这个想法是输出方面而不是整个句子的情感极性。例如:“食物很好,但服务很差”评论必须输出食物是积极的,服务是消极的。我阅读了 Richard Socher 关于 RNTN 模型的细粒度情感分类器的论文,但我想我需要为不同领域的短语手动标记情感,并创建自己的树库以提高准确性。

这是我想到的另一种方法。有人可以用您的反馈验证/指导我吗 将方法分解为 2 个子任务。 1) 识别方面 2) 识别情绪

识别方面

  1. 使用词性标注器识别所有名词。这应该入围 可能在评论的所有方面。
  2. 使用这些名词的 word2vec 来确定相似名词并减少数据集大小

识别情绪

  1. 针对评分为 1、2、4、5 的评论训练 CNN 或密集网络模型(忽略 3 因为我们需要有极性的数据)
  2. 将测试集评论分解成短语(例如“食物很好”),然后使用上述模型对它们进行评分
  3. 找到第一个子任务中确定的方面并将它们标记为 他们各自的短语。

【问题讨论】:

标签: nlp stanford-nlp sentiment-analysis


【解决方案1】:

我不知道如何回答这个问题,但有几点建议:

  1. 查看神经网络文献中的多任务学习,并尝试使用端到端神经网络处理多项任务。
  2. 使用预训练的词向量(如 w2v 或 glov)作为输入。
  3. 在使用互联网数据时不要依赖 pos 标记器,
  4. 找到一种方法来在您的设计中表示您的名称实体和 oov。
  5. 不要忽视 3!
  6. 您应该定期注释一些数据。

【讨论】:

    猜你喜欢
    • 2019-04-24
    • 1970-01-01
    • 2015-07-17
    • 1970-01-01
    • 1970-01-01
    • 2015-06-02
    • 1970-01-01
    • 2022-01-16
    • 1970-01-01
    相关资源
    最近更新 更多