【问题标题】:wrong language detection with google translate (multiple languages)谷歌翻译错误的语言检测(多种语言)
【发布时间】:2016-02-02 14:03:15
【问题描述】:

我目前正在尝试翻译包含多种语言的段落。

如果我们可以说,现在我已经使用 google translate API 实现了: hello bye hola 它会将语言检测为英语,如果它: hello hola adios 然后它会检测到西班牙语。

因此,基本上无论哪种语言在句子/段落中的字数最多,它都会检测到该语言。现在有趣的是,谷歌翻译他们实际上有这个功能。

有什么办法可以解决这个问题,让它只检测外语而不检测英语?

【问题讨论】:

    标签: google-translate language-detection google-language-api


    【解决方案1】:

    不,谷歌翻译 API 没有办法做到这一点,因为在他们的公共 API 中没有公开的机制。

    如果您使用备用语言检测库,您可以定义一个阈值,在该阈值下删除较少表示的语言的内容。如果英文内容占整个样本文本的比例低于(例如)30%,这将允许您删除英文内容。

    例如,查看optimaize/language-detector 项目中的RemoveMinorityScriptsTextFilterTest 类。

    【讨论】:

      猜你喜欢
      • 2015-03-12
      • 2015-03-29
      • 1970-01-01
      • 2019-05-29
      • 1970-01-01
      • 1970-01-01
      • 2010-12-18
      • 2012-11-08
      相关资源
      最近更新 更多