字符串编码

  • 计算机只能处理数字,文本转换为数字才能处理。计算机中8个bit 作为一个字节,一个字节最大的数字为 2812^8 - 1 = 255
  • ASCII 原本位一个字节一个字符,是美国人的标准编码
  • ASCII 处理中文明显不够,所以中国用GB2312 编码,两个字节进行编码 。同理,各国都会有自己的编码,这是需要全部统一,进行统一编码
  • unicode 统一了编码
  • ASCII & Unicode
    • 字母A用ASCII编码十进制是65, 二进制 0100 0001
    • 汉字 “中”已经超出了ASCII编码范围,用unicode 编码是20013, 二进制是 01001110 00101101
    • A 用unicode 编码只需要前面补0二进制是 0000 0000 0100 0001
  • 乱码问题解决了,但是如果内容是全英文,unicode 比 ascII 需要多一倍的空间,传输需要多一倍的传输
  • UTF- 8 是可变长编码,把英文变长一个字节,汉字3个字节,特别生僻字变4-6个字节,这样就解决了上个问题
  • unicode, utf8

相关文章:

  • 2021-08-11
  • 2021-12-14
  • 2021-11-25
  • 2021-09-14
  • 2021-06-12
  • 2021-06-13
  • 2022-02-18
  • 2021-07-09
猜你喜欢
  • 2021-09-06
  • 2021-07-10
  • 2022-12-23
  • 2018-05-15
  • 2021-11-16
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案