【问题标题】:How to translate static web content with Google Translate如何使用谷歌翻译翻译静态网页内容
【发布时间】:2015-03-03 21:56:38
【问题描述】:

我们有一个由完全静态的英语内容组成的“网站”。 该网站的 HTML 文件总数约为 300MB 数据(即不包括图像,仅 HTML 文本文件。)

内容通常在一个简单的网络服务器设备中离线使用,用于没有互联网可用的偏远地区学校。

如果我从 Internet 上的网络服务器提供相同的内容,并提供 Google 翻译网站的 URL,那么翻译结果会非常好,我们可以通过链接在网站上浏览,就像在原始网站中一样。

所以我们知道谷歌翻译会很好地翻译内容,并且通过在线谷歌翻译服务自动完成。

我的问题是如何最好地使用 Google 翻译服务或其他类似服务将 HTML 文件批量翻译成其他几种语言。

翻译显然必须识别 HTML 并只翻译实际的英语语言内容,而在线 Google 翻译服务可以完美地做到这一点。

这似乎是一个相当普遍的要求,但我找不到关于如何去做的简单答案。

如果有任何建议,我将不胜感激。

提前致谢。

【问题讨论】:

  • Google 翻译会忽略 html 标记,您只需将文件发送到他们的 API。 API 仅花费 20 美元/百万字符,因此您可能会为整个站点花费 500-750 美元。您可以通过编写一个 sax 样式的 html 解析器来将其减半,该解析器通过将数据发送到 api 来处理数据

标签: html language-translation


【解决方案1】:

感谢您的建议。

如果将文件一一提交给 Google API,如果它返回的文件标记未更改且内容已翻译,那么它会很好地工作。

但是,我认为每种语言翻译 20 美元/M 字符 X 300 MB 数据大约需要 6000 美元。我们至少需要三种语言的翻译。如此接近 20,000 美元 - 对于一个基于社区、完全自愿配备人员的项目来说,这可能有点高,即使通过一些巧妙的编码减少了一些费用。

Localise.js 为内部翻译内容提供“无限免费机器翻译”。所以这看起来值得跟进。

我们需要的一种语言是高棉语,所以看看它是否包含在他们的 100 种语言列表中会很有趣(我还没有在他们的网站上发现)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2014-02-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-01-31
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多