【问题标题】:Dealing with string case and diacritics in python在 python 中处理字符串大小写和变音符号
【发布时间】:2013-07-07 06:30:49
【问题描述】:

我正在处理一些文本,我需要将所有文本转换为小写,但文本是法语,我需要保留所有变音符号,以便“È”转换为“è”,等等如果它有帮助,我实际上不需要最终输出作为文本,只需要每个唯一字符的标识符(例如数字)(其中“e”和“è”是不同的字符)。有什么建议吗?

【问题讨论】:

  • 哪个 Python 版本?

标签: python string diacritics


【解决方案1】:

使用 Unicode 字符串:

>>> u"É".lower()
'é'

【讨论】:

    【解决方案2】:

    我认为您的问题是您正在转换为 ascii。 如果您尝试类似

    word = u"HÈLLO"
    print word.lower()
    

    应该这样做

    【讨论】:

      猜你喜欢
      • 2020-09-13
      • 2017-08-23
      • 2012-05-10
      • 2012-11-08
      • 1970-01-01
      • 2016-07-01
      • 1970-01-01
      • 2014-09-10
      • 1970-01-01
      相关资源
      最近更新 更多