【发布时间】:2020-08-28 23:32:02
【问题描述】:
上面的字符串是我输入的,下面的字符串是从数据库中提取的。
bytes('TOYOTA', 'utf-8')
>> b'TOYOTA'
bytes('ΤΟΥΟΤΑ', 'utf-8')
>> b'\xce\xa4\xce\x9f\xce\xa5\xce\x9f\xce\xa4\xce\x91'
当我想检查它是否存在时,这会导致不良结果
'TOYOTA' == 'ΤΟΥΟΤΑ'
>> False
知道如何“修复”不正确的字符串吗?
【问题讨论】:
-
这些不是相同的字符串。这些只是看起来相似。搜索一个 i。 e.使用浏览器搜索,你不会找到两者
-
@MarcinOrlowski 根据字体或应用程序,它们实际上看起来相同。在我的网络浏览器中它们看起来相同,而在终端中它们看起来完全不同。
-
哪个是“不正确”的字符串?如果数据库的实际内容是希腊文本,那么您肯定不想替换字母并破坏数据,对吧?所以这里唯一的问题是搜索查询。
TOYOTA不是ΤΟΥΟΤΑ不管它们看起来多么相似。
标签: python python-3.x unicode