【发布时间】:2014-11-21 00:25:58
【问题描述】:
我有以下命令将 Unicode 字符替换为 ASCII 字符。
sed -i 's/Ã/A/g'
问题是我的 Unix 环境中的 sed 命令无法识别 Ã,所以我假设您将其替换为十六进制值。如果我改用C3,语法会是什么样子?
我将此命令用作其他字符的模板,我想用空格替换,例如:
sed -i 's/©/ /g'
【问题讨论】:
-
你的意思是这样吗? stackoverflow.com/questions/22450563/…
-
您的终端使用什么字符集?输入文本使用什么编码? UTF-8 中的 Ã 是 0xC3 0x83,而字符 0x83 是 ISO 8859-1 中的控制码,所以这可能是个问题。我想你不能只在你的系统上设置
LANG=en_US.UTF-8。 -
"sed" 将完成这项工作。请看我的回答。
标签: bash shell unix unicode sed