【问题标题】:Sentiment analysis Google Prediction API情绪分析 Google Prediction API
【发布时间】:2014-01-13 12:41:11
【问题描述】:

我正在阅读有关 Google Prediction API 的信息,但无法找出文档的一部分。

来自use cases 我在这部分有点卡住了:

每一行只能分配一个标签,但您可以应用多个 通过重复一个示例并应用不同的示例来标记一个示例 给每个人贴上标签。例如:“兴奋”、“天哪!刚刚度过了一个美妙的 天!” “烦人”,“天哪!刚刚度过了美好的一天!”如果您发送推文 对于此模型,您可能会得到如下分类: “兴奋”:0.6,“烦人”:0.2。

为什么在没有更多功能的情况下会设置“excited”:0.6,“annoying”:0.2。为什么首选兴奋?

【问题讨论】:

    标签: prediction google-prediction


    【解决方案1】:

    不是“兴奋”标签是首选,而是消息实际上应该被归类为“兴奋”而不是“烦躁”的概率。

    假设我对情绪有 2 个分类:“看涨”和“看跌”。然后,我在 Prediction API 中使用偶数的“看涨”和“看跌”训练数据训练模型。当我向 Prediction API 提交消息以获取情绪时,它会读取文本并根据消息中的单词分配“看涨”和“看跌”概率。概率总和为 1。

    同样,并不是一个标签比另一个标签更受欢迎,而是消息“兴奋”的概率是“恼怒”的 3 倍。

    【讨论】:

    • 是的,但在上面的例子中,概率总和不等于 1。这就是我要问的情况。为什么它给标签分配了 6 的概率,而两个句子的内容相同?
    • 我认为这是一个文档错误。因为你是对的:概率加起来应该是 1。在测试我自己的分类模型时,我测试的所有实例加起来都是 1。
    【解决方案2】:

    如果您仅使用这 2 个示例训练模型,即句子“OMG!刚刚度过了美好的一天!”的“兴奋”和“烦人”标签,那么在查询类似“OMG!刚刚度过了美好的一天!”应该是“兴奋”:0.5,“烦人”:0.5。

    所以谷歌文档中可能没有完美地解释这种情况。我猜他们更专注于解释可以将 2 个不同的标签与完全相同的句子相关联。

    【讨论】:

    • 是的,虽然现在是这样
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-02-02
    • 1970-01-01
    • 2011-08-29
    • 1970-01-01
    • 2014-12-11
    相关资源
    最近更新 更多