【发布时间】:2020-04-13 09:52:13
【问题描述】:
这是this question 的延续。我有这个字符串;
s = 'A ligeira raposa marrom ataca o cão preguiçoso Быстрая коричневая лиса прыгает через ленивую собаку +='
我想保留俄语字母并删除其余字母。因此,我想获得葡萄牙字母表中所有可能的字母,以便我可以将其应用于任何行。
我的问题是可以从网站上获取某种语言的所有可能字母吗?或直接从计算机本身。什么都容易。
感谢和最好的问候
迈克尔
【问题讨论】:
-
也许
s.encode()(编码为UTF-8)可以帮助你一些想法。至少在这个例子中,每个语言单词的字节表示看起来非常不同。 -
您好,感谢您的回复。谢谢和最好的问候
标签: python unicode linguistics