【问题标题】:Command or option for the xgettext, msginit, msgfmt sequence for setting the MIME type?用于设置 MIME 类型的 xgettext、msginit、msgfmt 序列的命令或选项?
【发布时间】:2010-11-08 05:23:02
【问题描述】:

msgfmt “invalid multibyte sequence” error on a Polish text 通过手动编辑模板文件中的 MIME Con​​tent-Type 字符集得到更正。是否有一些用于设置 MIME 类型的 xgettext、msginit、msgfmt 序列的命令或选项?

cat >plt.cxx <<EOF
// plt.cxx
#include <libintl.h>
#include <locale.h>
#include <iostream>
int main (){
    setlocale(LC_ALL, "");
    bindtextdomain("plt", ".");
    textdomain( "plt");
    std::cout << gettext("Invalid input. Enter a string at least 20 characters long.") << std::endl;
}
EOF
g++ -o plt plt.cxx
xgettext --package-name plt --package-version 1.2 --default-domain plt --output plt.pot plt.cxx
sed --in-place plt.pot --expression='s/CHARSET/UTF-8/'
msginit --no-translator --locale pl_PL --output-file plt_polish.po --input plt.pot
sed --in-place plt_polish.po --expression='/#: /,$ s/""/"Nieprawidłowo wprowadzone dane. Wprowadź ciąg przynajmniej 20 znaków."/'
mkdir --parents ./pl_PL.utf8/LC_MESSAGES
msgfmt --check --verbose --output-file ./pl_PL.utf8/LC_MESSAGES/plt.mo plt_polish.po
LANGUAGE=pl_PL.utf8 ./plt

【问题讨论】:

    标签: linux internationalization gettext


    【解决方案1】:

    直接设置输出字符编码没有参数,但这应该在实践中没有问题,因为您的 PO 编辑器在保存 PO 文件时会自动使用适当的字符编码(一个支持翻译中使用的所有字符),并将文件中的CHARSET替换为编码的名称。如果没有,请提交错误。

    唯一的问题是如果 POT 文件包含非 ASCII 字符,但 xgettext 确实 有一个 --from-code 参数,它指定 输入的编码 文件。如果输入包含非 ASCII 字符并且 --from-code 设置为正确的编码,则输出 POT 文件将字符编码设置为 UTF-8(这不必等于输入字符编码)。但是,如果输入文件只包含 ASCII 字符,--from-code=UTF-8 将很遗憾无效。

    msginit 实际上会自动将字符编码设置为适合所选目标语言环境的“适当”值。但是,字符编码对的语言环境列表似乎已经过时了。 UTF-8 现在确实是所有语言的最佳选择。

    另一种方法是使用pot2po 而不是msginit。这总是自动使用 UTF-8,AFAICS。但是,与msginit不同的是,它不会自动填写PO文件的复数形式,这可能是也可能不是问题(有人认为这是PO编辑的工作)。

    【讨论】:

      【解决方案2】:

      只需提供完整的语言环境名称,msginit 就会正确设置字符集

      msginit --no-translator --input=xx.pot --locale=ru_RU.UTF-8
      

      结果

      "Language: ru\n"
      "Content-Type: text/plain; charset=UTF-8\n"
      

      【讨论】:

        猜你喜欢
        • 2021-07-11
        • 1970-01-01
        • 1970-01-01
        • 2013-09-03
        • 2015-06-16
        • 2011-07-04
        • 2011-07-28
        • 2012-08-22
        • 2012-09-10
        相关资源
        最近更新 更多