【发布时间】:2021-09-19 06:11:29
【问题描述】:
我有一个情感分析数据集,分为三类:正面、负面和中性。我还有一个单词列表(主要是名词),我想为其计算情绪值,以了解这些实体在数据集中“如何”(积极或消极地)被谈论。我阅读了一些在线资源,例如博客,并考虑了几种计算特定单词 X 的情绪分数的方法。
-
计算有多少数据实例(句子)中包含单词 X、“正面”标签、“负面”标签和“中性”标签。然后,计算该词的加权平均情绪。
-
采用未经训练的通用 BERT 架构,然后使用数据集对其进行训练。然后,将列表中的每个单词传递给经过训练的模型,以获得该单词的情感分数。
这些方法是否有意义?如果是这样,你能推荐一些我可以看的相关作品吗? 如果这些方法没有意义,您能否告诉我如何计算给定数据集中某个单词的情绪得分?
【问题讨论】:
-
我否决了这个问题,因为它似乎是计算机科学的问题 [cs.stackexchange.com/users/125101/] 或其他社区论坛...
标签: nlp dataset sentiment-analysis bert-language-model