【问题标题】:Convert xlf to html using okapi使用 okapi 将 xlf 转换为 html
【发布时间】:2014-07-07 23:50:19
【问题描述】:
我已经实现了一个本地服务,它允许将多种格式(如 html、docx、xlsx、tmx...)转换为 XLIFF。在使用 xlf 生成的文件执行特定过程后,我想将其恢复为原始格式。我为此使用了 okapi 库,并且一切正常。
我想知道 okapi 是否实现了将 xlf 转换为其原始文件格式的机制,特别是将 xlf 转换为 html(这种格式对我来说是强制性的)。
有没有合适的方法?
提前致谢
【问题讨论】:
标签:
file-conversion
xliff
【解决方案1】:
是的,这通常是可能的。 Okapi 将其称为 merging,它要求源 HTML(或其他格式)文件除了已翻译的 XLIFF 之外可用。
执行此操作的常用方法是使用一对彩虹管道。第一个(“提取”)管道如下所示:
- 用于过滤事件的原始文档
- [其他步骤,如分段,是
此处可选]
- Rainbow 翻译工具包创建(选择“通用
XLIFF”作为类型)
这将生成一个“翻译工具包”,其中包含源文件、提取的 XLIFF 以及名为 manifest.rkm 的文件中的一些元数据。然后,您可以修改 XLIFF 以执行翻译等。然后,使用另一个管道执行合并:
- 用于过滤事件的原始文档
- Rainbow 翻译工具包合并
有点令人困惑,这个合并管道的源文件应该是翻译工具包的 manifest.rkm 文件,而不是 XLIFF 或源文件。 Okapi 将解析清单并找出其他所有内容的位置,然后将 XLIFF 的翻译合并回 HTML 的新输出副本。
如果您对 XLIFF 做了足够可怕的事情,以至于 Okapi 无法再将翻译的片段映射回原始文档,则此过程可能会失败。
在不使用该工具包的情况下,一种快速而简单的方法是使用与 Okapi 捆绑在一起的 tikal 命令行工具。首先,用这个把test.html提取成test.html.xlf:
tikal.sh -fc okf_html -x test.html
然后,将翻译后的test.html.xlf 合并到输出test.out.html:
tikal.sh -fc okf_html -m test.html.xlf