【发布时间】:2013-07-07 06:30:49
【问题描述】:
我正在处理一些文本,我需要将所有文本转换为小写,但文本是法语,我需要保留所有变音符号,以便“È”转换为“è”,等等如果它有帮助,我实际上不需要最终输出作为文本,只需要每个唯一字符的标识符(例如数字)(其中“e”和“è”是不同的字符)。有什么建议吗?
【问题讨论】:
-
哪个 Python 版本?
标签: python string diacritics
我正在处理一些文本,我需要将所有文本转换为小写,但文本是法语,我需要保留所有变音符号,以便“È”转换为“è”,等等如果它有帮助,我实际上不需要最终输出作为文本,只需要每个唯一字符的标识符(例如数字)(其中“e”和“è”是不同的字符)。有什么建议吗?
【问题讨论】:
标签: python string diacritics
使用 Unicode 字符串:
>>> u"É".lower()
'é'
【讨论】:
我认为您的问题是您正在转换为 ascii。 如果您尝试类似
word = u"HÈLLO"
print word.lower()
应该这样做
【讨论】: