【发布时间】:2011-02-26 20:03:22
【问题描述】:
echo – | tr ’ X
在我的 Mac 上:正确打印 -
在 Ubuntu 10.10 上:打印 XX。
为什么?
作为参考,第一个字符是 'EN DASH' (U+2013),第二个是 'RIGHT SINGLE QUOTATION MARK' (U+2019)
编辑:我现在改用 Perl。我使用的魔法咒语是:
perl -CSD -p -Mutf8 -e 'tr/A-ZÁÉÍÓÚÀÈÌÒÙÄËÏÖÜÂÊÎÔÛÇa-zäëïöüáéíóúàèìòùâèìòùñçßœ/ /cs'
意思是:除了我能想到的所有字母,用空格替换任何字符,然后压缩空格。
【问题讨论】:
-
LANG在每种情况下设置的环境变量是什么? -
在这两种情况下都没有设置;两台机器上的 LC_ALL 都设置为 en_US.UTF-8。
标签: ubuntu encoding character-encoding