【发布时间】:2016-05-17 07:33:26
【问题描述】:
我需要用 UNICODE (Sinhala) 替换 ANSII 字符。我使用带有循环的列表来执行以下操作,
for i in range (len(charansi)):
for j in range (len(charUni)):
s = charansi[i] + ansimod[j]
v = charUni[i] + modUni[j]
textSource = textSource.replace(s, v)
如果我们使用 n + uu 作为 ANSII 输入,它应该将 නූ 作为 Unicode 输出。但取而代之的是 න ූ
澄清更多,
charansi = n
ansimod = uu
charUni = න
modUni = ූ
这个 න 和 ූ 必须不带空格连接。我认为 ZWJ (\u200D) 在这里发挥了作用。所以我尝试了
v = u"\u200D".join((consonantsUni[i], vowelModifiersUni[j]))
给出相同的结果。
我该如何解决这个问题?
【问题讨论】:
标签: string python-3.x unicode