【问题标题】:How to Dictionary only training?如何仅字典训练?
【发布时间】:2020-10-17 02:33:31
【问题描述】:

我想只用一个词汇表来训练基本的翻译系统。

语言对是 ENtoKO。我按照文章中描述的方式在字典选项卡中训练了 1,700 个句子。

我没有在“训练”选项卡中选择任何内容。

https://cognitive.uservoice.com/knowledgebase/articles/1166938-hub-building-a-custom-system-using-a-dictionary-o

enter image description here

但是,期望和系统没有翻译这些条款。并且与文档(Microsoft Translator Hub User Guide.pdf)不同,培训完成了很多时间。

仅字典训练您现在可以在仅使用字典而没有其他并行文档的情况下训练自定义翻译系统。该字典没有最小大小,一个条目就足够了。只需上传字典,这是一个以语言标识符作为列标题的 Excel 文件,将其包含在您的训练集中,然后点击 train。培训很快完成,然后您可以使用该词典部署和使用您的系统。无论上下文如何,字典都会以 100% 的概率应用您提供的翻译。这种类型的训练不会产生 bleu 分数,并且此选项仅在 MS 模型可用于给定语言对时才可用。

  1. 为什么这个培训只输 silp 字典想知道。如果更新的功能不是预定时间表?

  2. 另外,我想知道是否有计划将字典应用功能也引入到 NMT Api 功能中。

【问题讨论】:

    标签: microsoft-translator


    【解决方案1】:

    现在可以使用 Custom Translator (Preview) 自定义 NMT,我们希望在自定义翻译器普遍可用时可以使用字典功能。

    您确实需要使用 Microsoft Translator Text API v3 和自定义翻译支持语言对,其中 NMT languages 现在可用(韩语是一种 NMT 语言)。

    谢谢。

    【讨论】:

    • 词典功能是否已启动并正在运行?我正在尝试使用仅受过字典训练的机器,但它没有给出预期的结果。
    【解决方案2】:

    是的。 您可以使用您的字典自定义我们的 en-ko 通用域基线。请关注我们的quick start documentation.

    【讨论】:

    • 我创建了一个新模型,仅使用小字典文件(6 个字符串)进行字典训练,用于测试目的。我仍然没有看到字典提供的字符串被优先翻译。我仍然得到一般翻译,而不是字典文件中提供的翻译。我测试了 en-ko 语言对。此外,我使用了带有自定义翻译器的 Microsoft Translator Text API v3。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-09-10
    • 2021-10-12
    • 1970-01-01
    • 1970-01-01
    • 2019-11-15
    • 2023-01-03
    • 2013-11-08
    相关资源
    最近更新 更多