print(type('李杰'.encode('utf-8')))#<class 'bytes'>
print(type('李杰'.encode('gbk')))#<class 'bytes'>
print(len('李杰'.encode('utf-8')))#6
print(len('李杰'.encode('gbk')))#4
print(len(',。'.encode('gbk')))#4

 英文和符号:

print(type('li'.encode('utf-8')))#<class 'bytes'>
print(type('li'.encode('gbk')))#<class 'bytes'>
print(len('li'.encode('utf-8')))#2
print(len('li'.encode('gbk')))#2
print(len(',.'.encode('gbk')))#2

  所以:

utf-8编码:一个中文包含繁体字等于三个字节,一个英文字符等于一个字节。
gbk编码:一个中文包含繁体字等于二个字节,一个英文字符等于一个字节。

 

相关文章:

  • 2021-12-06
  • 2021-07-06
  • 2022-01-28
猜你喜欢
  • 2021-12-06
  • 2021-11-29
  • 2021-11-29
  • 2021-07-04
  • 2021-11-27
相关资源
相似解决方案