【发布时间】:2010-09-30 18:46:09
【问题描述】:
我正在寻找一个简单的 Python 函数,它接受一个字符串并返回一个类似的字符串,但所有非 ascii 字符都转换为最接近的 ascii 等效字符。 例如,应该删除变音符号和诸如此类的东西。 我想一定有一个非常规范的方法来做到这一点,并且有很多相关的 stackoverflow 问题,但我没有找到一个简单的答案,所以它似乎值得一个单独的问题。
输入/输出示例:
"Étienne" -> "Etienne"
【问题讨论】:
-
你如何定义“最接近”?
-
好问题!我想我希望不必定义它,在某处有一些标准的、可接受的映射。我敢肯定这比我想象的要做得好,但部分解决方案也很有价值。
-
iconv可以使用//TRANSLIT标志来实现,但不确定是否有合适的 Python 绑定。
标签: python regex character-encoding ascii special-characters