【发布时间】:2014-07-16 11:18:56
【问题描述】:
我有一个包含以下文本的文件:
óó
é
ó
óóó
我希望能够读取这些字符并在 perl 中对其进行操作。
其实我想用s/ó/o/g这样的语句;等等。
当我为具有上述文本的文件键入 file -i file.txt 时,我知道该文件是“常规文件”。所以我认为这意味着我不需要特别注意在 perl 中处理这个文件。但是,仅使用阅读文件并吐出我阅读的内容就会给出问号。很明显,有些东西不见了。
我在 perl 脚本的开头尝试了“使用字节”,但这没有帮助。
任何想法我可以如何在 perl 中读取此文件并按照上述方式操作它?
顺便说一下,文件的 xxd 转储,例如包含:
c3b3c3b30ac3a90ac3b30ac3b3c3b3c3b30ac3b30ac3b3c3b3c3b30ac3b3
如果有人需要恢复它使用的确切字符。
【问题讨论】:
-
提示:utf-8 可能会有所帮助(我不懂 Perl,所以你可能想查一下)
标签: perl encoding character-encoding