【发布时间】:2021-03-12 14:57:52
【问题描述】:
谁能帮我解决这个问题,我正在尝试构建 NLP 模型,在其中收集用户对应用程序的评论和评分。有时用户写了很好的评论但也给出了低评价。我如何识别这些评论。 CSV 文件包含用户评论、评分和姓名列
【问题讨论】:
标签: python machine-learning nlp data-science
谁能帮我解决这个问题,我正在尝试构建 NLP 模型,在其中收集用户对应用程序的评论和评分。有时用户写了很好的评论但也给出了低评价。我如何识别这些评论。 CSV 文件包含用户评论、评分和姓名列
【问题讨论】:
标签: python machine-learning nlp data-science
我认为这里需要更多信息来理解您的问题...
您的 NLP 模型的最终目标是什么?您想构建一个区分正面和负面评论的情绪分类器吗?
有时用户写的评价不错,但评分也很低。
我假设你的意思是用户给出了好评但评分很低,对吧?
在这种情况下,您可以使用预训练的情绪分类器来获得每条评论的预测情绪。然后,您可以将其与您在 CSV 上的评分进行比较,并挑选出非常不同的评分。
然而,遗憾的是,清理不一致数据的最佳方法通常是进行手动清理……一一查看评论,并根据评论确定评分是否合理。
另一种方法是完全忽略这种不一致的评论,并希望它们如此之少,不会弄乱你的模型
【讨论】: