【发布时间】:2010-09-09 04:56:39
【问题描述】:
GNU sed version 4.1.5 似乎因国际字符而失败。这是我的输入文件:
Gras Och Stenar Trad - From Moja to Minneapolis DVD [G2007DVD] 7812 | X
<br>
Gras Och Stenar Trad - From Möja to Minneapolis DVD [G2007DVD] 7812 | Y
(注意第二行的变音符号。)
当我这样做时
sed 's/.*| //' < in
我希望只看到X 和Y,因为我已要求删除直到'|' 的所有字符以及超出它的空间。相反,我得到:
X<br>
Gras Och Stenar Trad - From M? Y
我知道我可以使用 tr 删除国际字符。首先,但有没有办法只使用 sed?
【问题讨论】:
-
这个问题似乎已经用 GNU sed 解决了(在 4.2.2 版本上测试)。
标签: linux internationalization sed character