【发布时间】:2018-04-06 01:02:52
【问题描述】:
我开始研究对搜索查询进行一些机器翻译,并一直在尝试想出不同的方法来评估我的翻译系统在迭代之间和与其他系统的比较。首先想到的是从一群人那里得到一组来自 mturk 的搜索词的翻译,并说每个都是有效的,或者类似的东西,但这会很昂贵,并且可能容易让人输入错误的翻译.
现在我在想一些更便宜或更好的东西,我想我会向 StackOverflow 询问想法,以防已经有一些可用的标准,或者以前有人试图找到其中一个。例如,有谁知道谷歌翻译如何评价他们系统的各种迭代?
【问题讨论】:
标签: multilingual metrics machine-translation