【发布时间】:2012-07-07 22:24:28
【问题描述】:
可能重复:
Replacing unicode punctuation with ASCII approximations
我想我完全可以责怪微软,但我的数据库中存储了一些字符串,它们有这些破折号和引号,它们不是普通的破折号和引号。我认为他们正在努力变得聪明或其他......
它在页面上显示得很好,但我需要将它作为 ASCII 发送到不同的程序。
我看过这个问题Convert Unicode to ASCII without changing the string length (in Java),特别是@Denis Tulskiy 的回答,但它把花哨的破折号变成了问号,而不是普通的破折号。如何修改它以处理这几个字符?
【问题讨论】:
标签: regex unicode utf-8 replace ascii