NLP 方面挖掘方法

【问题标题】：NLP Aspect Mining approachNLP 方面挖掘方法
【发布时间】：2018-01-14 01:37:11
【问题描述】：

我正在尝试根据亚马逊消费者对耐用型洗衣机、冰箱的评论将其实现为方面矿工。这个想法是输出方面而不是整个句子的情感极性。例如：“食物很好，但服务很差”评论必须输出食物是积极的，服务是消极的。我阅读了 Richard Socher 关于 RNTN 模型的细粒度情感分类器的论文，但我想我需要为不同领域的短语手动标记情感，并创建自己的树库以提高准确性。

这是我想到的另一种方法。有人可以用您的反馈验证/指导我吗将方法分解为 2 个子任务。 1) 识别方面 2) 识别情绪

识别方面

使用词性标注器识别所有名词。这应该入围可能在评论的所有方面。
使用这些名词的 word2vec 来确定相似名词并减少数据集大小

识别情绪

针对评分为 1、2、4、5 的评论训练 CNN 或密集网络模型（忽略 3 因为我们需要有极性的数据）
将测试集评论分解成短语（例如“食物很好”），然后使用上述模型对它们进行评分
找到第一个子任务中确定的方面并将它们标记为他们各自的短语。

【问题讨论】：

见这里：stackoverflow.com/questions/45019446/…
Identifying multiple categories and associated sentiment within text的可能重复

标签： nlp stanford-nlp sentiment-analysis

【解决方案1】：

我不知道如何回答这个问题，但有几点建议：

查看神经网络文献中的多任务学习，并尝试使用端到端神经网络处理多项任务。
使用预训练的词向量（如 w2v 或 glov）作为输入。
在使用互联网数据时不要依赖 pos 标记器，
找到一种方法来在您的设计中表示您的名称实体和 oov。
不要忽视 3！
您应该定期注释一些数据。

【讨论】：

猜你喜欢

2019-04-24
1970-01-01
2015-07-17
1970-01-01
1970-01-01
2015-06-02
1970-01-01
2022-01-16
1970-01-01

相关资源

下载 2022-12-23
下载 2023-03-16
下载 2021-06-07
下载 2022-12-01

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode