【发布时间】:2010-10-26 10:23:52
【问题描述】:
我正在构建一个在 TMX 中支持多语言的应用程序。我找到了一些适用于 windows 的编辑器,但由于我是在远程服务器上开发的,所以我正在寻找一个用于 linux 的命令行工具来翻译字符串并将它们写入 TMX 文件。 有人知道这样的工具吗?
【问题讨论】:
标签: linux command-line multilingual tmx
我正在构建一个在 TMX 中支持多语言的应用程序。我找到了一些适用于 windows 的编辑器,但由于我是在远程服务器上开发的,所以我正在寻找一个用于 linux 的命令行工具来翻译字符串并将它们写入 TMX 文件。 有人知道这样的工具吗?
【问题讨论】:
标签: linux command-line multilingual tmx
TMX,(Translation Memory eXchange) 格式是一个简单的 XML 文件。您可以在此处找到确切的规格:http://www.lisa.org/Translation-Memory-e.34.0.html#c33。
您还可以在那里找到验证工具。
您会注意到,TMX 格式有多个版本。假设您不关心格式化信息,最旧的格式是最广泛支持的。
这是一个 TMX 代码示例:
<body>
<tu creationdate="20080317T093024Z" creationid="user_name">
<tuv xml:lang="EN-US">
<seg>English text</seg>
</tuv>
<tuv xml:lang="FR-FR">
<seg>French text</seg>
</tuv>
...
</tu>
</body>
有几个支持 TMX 的开源项目,如 OmegaT (Java) 和 Okapi Framework (Java & .NET),但坦率地说,直接输出 TMX 可能更容易。
我的意思是,无论使用哪种工具,您都必须指定源语言代码和目标语言代码(警告:这是 TMX 工具之间兼容性问题的最大单一来源。在接受的内容上要慷慨... ),您还必须输出语言字符串并指定它们使用的语言。
因此,只需用 XML 标记包装您的字符串,打上时间戳,您就完成了。
【讨论】:
我在 TMX 的维基百科页面上找到了 po2tmx
已编辑以添加示例 .po 文件
.po 文件格式:
msgid "This is my first string"
msgstr "This is my first string"
msgid "This is my second string"
msgstr "This is my second string"
【讨论】:
bitext2tmx,也许吧?它是用java编写的,在linux上运行良好。它合并来自两个纯文本文件的数据。我没试过,但它looks like 它的编辑功能还可以。
【讨论】: