【问题标题】:Transcript transformation for sentiment analysis情绪分析的转录转换
【发布时间】:2021-12-20 20:19:14
【问题描述】:

我正在对用户的 UX 网站测试成绩单进行情绪分析。我从测试会话中得到成绩单,然后我分析成绩单以进行情绪分析——用户对网站的看法是什么,用户遇到了什么问题,他是否有任何问题、卡住、迷路。由于这是非常特定于域的,我正在测试 TextBlob 和 Vader,看看哪个能提供更好的结果。我的问题是在流程的开始 - 语音到文本 API 的成绩单并不完美。 句子(句号)未被捕获或很少我不确定应该在什么级别进行分析,因为我希望我可以在句子级别进行分析。我尝试制作 n-gram 并分析那些短文本块,但这并不理想,而且结果有点难以阅读——因为有些部分会重复。除此之外,我还进行经典的文本清理、标记化、pos 标记、词形还原并将其提供给 TextBlob 和 Vader。

成绩单示例:okay so if I go just back over here it has all the information I need it seems like which is great so I'm pretty impressed with it similar to how a lot of government websites are set up over here it looks like I have found all the information I need it's a great website it has everything overall though it had more than enough information...

我做到了:

ngram_object = TextBlob(lines)
ngrams = ngram_object.ngrams(n=4) 

这给了我类似的东西(实际上是一个 WordList):[okay so if I, so if I go, if I go just...]

那么结果是这样的:

62  little bit small    -0.21875    Negative  
61  like little bit     -0.18750    Negative

0 information hard find not see -0.291666667    Negative
1 hard find not see information -0.291666667    Negative

有没有更好的方法来分析块中的非结构化文本而不是完整的转录本?

这使得很难捕捉到网站的问题所在。更改 API 并不是一个真正的选择,因为我正在使用一些东西,这些东西是给我的,用作这个特定情绪分析问题的数据收集。

任何提示或建议将不胜感激,找不到任何人做类似的事情。

【问题讨论】:

  • 请提供足够的代码,以便其他人更好地理解或重现问题。

标签: nlp sentiment-analysis text-processing textblob vader


【解决方案1】:

我不确定你真正想要什么,但也许你可以看看语音情感分析?我读过 RAVDESS,一个对情绪分类有用的数据库。看一看:https://smartlaboratory.org/ravdess/

【讨论】:

    猜你喜欢
    • 2022-10-09
    • 2013-02-02
    • 2014-12-11
    • 1970-01-01
    • 1970-01-01
    • 2011-05-10
    • 2013-02-07
    • 2021-04-29
    • 2019-10-06
    相关资源
    最近更新 更多