【发布时间】:2020-03-29 15:26:01
【问题描述】:
我一直试图从患者在医院的评论中推断出及时性评分(基于患者等待时间的评分)。可用的数据是患者的评论和他们对整体体验的评分。问题是我没有为患者及时评分的标签,而是对整个体验的评分。 诸如“我已经等了很长时间,但这次经历是值得的”之类的评论具有良好的背景和良好的评级,应该会返回一个有点糟糕的及时性分数,同样的事情对于“等待时间很短,但它并不能证明不好是合理的”服务'。因此,撰写评论的人的背景/感觉也很重要。 我已经清理了评论并提取了与等待时间相关的部分句子(如果存在),并使用 TextBlob 或 VaderSentiment 等库来推断患者的情绪是否积极。问题是我有 20% 的情况是我从不同的库中获得了不同的结果,而且它们并不总是最有意义(等待时间长但在良好背景下的评论会返回良好的等待时间,但它应该在至少保持中立)。 我需要某种方式,我可以将句子的上下文和实际评分与他们等待的时间相关联并得出一个分数,这是一种考虑到整个句子但寻找特定的情绪分析讨论等待时间的上下文。
【问题讨论】:
标签: python machine-learning nlp unsupervised-learning