情绪分析 Google Prediction API答案

【问题标题】：Sentiment analysis Google Prediction API情绪分析 Google Prediction API
【发布时间】：2014-01-13 12:41:11
【问题描述】：

我正在阅读有关 Google Prediction API 的信息，但无法找出文档的一部分。

来自use cases 我在这部分有点卡住了：

每一行只能分配一个标签，但您可以应用多个通过重复一个示例并应用不同的示例来标记一个示例给每个人贴上标签。例如：“兴奋”、“天哪！刚刚度过了一个美妙的天！” “烦人”，“天哪！刚刚度过了美好的一天！”如果您发送推文对于此模型，您可能会得到如下分类： “兴奋”：0.6，“烦人”：0.2。

为什么在没有更多功能的情况下会设置“excited”：0.6，“annoying”：0.2。为什么首选兴奋？

【问题讨论】：

【解决方案1】：

不是“兴奋”标签是首选，而是消息实际上应该被归类为“兴奋”而不是“烦躁”的概率。

假设我对情绪有 2 个分类：“看涨”和“看跌”。然后，我在 Prediction API 中使用偶数的“看涨”和“看跌”训练数据训练模型。当我向 Prediction API 提交消息以获取情绪时，它会读取文本并根据消息中的单词分配“看涨”和“看跌”概率。概率总和为 1。

同样，并不是一个标签比另一个标签更受欢迎，而是消息“兴奋”的概率是“恼怒”的 3 倍。

【讨论】：

【解决方案2】：

如果您仅使用这 2 个示例训练模型，即句子“OMG！刚刚度过了美好的一天！”的“兴奋”和“烦人”标签，那么在查询类似“OMG！刚刚度过了美好的一天！”应该是“兴奋”：0.5，“烦人”：0.5。

所以谷歌文档中可能没有完美地解释这种情况。我猜他们更专注于解释可以将 2 个不同的标签与完全相同的句子相关联。

【讨论】：