【发布时间】:2012-09-12 15:13:11
【问题描述】:
我了解unicodedata.normalize 将变音符号转换为非变音符号:
import unicodedata
''.join( c for c in unicodedata.normalize('NFD', u'B\u0153uf')
if unicodedata.category(c) != 'Mn'
)
我的问题是(并且可以在此示例中看到):unicodedata 是否有办法将组合的字符变音符号替换为对应的字符? (u'œ' 变成 'oe')
如果不是,我认为我将不得不对这些进行打击,但我不妨用所有 uchars 及其对应物编译我自己的 dict,完全忘记 unicodedata...
【问题讨论】:
标签: python unicode replace diacritics