【发布时间】:2018-12-27 22:02:31
【问题描述】:
我对 MySQL 排序规则及其编码感到困惑,人们通常使用以下三种排序规则之一:
- utf8mb_bin
- utf8mb4_general_ci
- utf8mb4_unicode_520_ci
我不明白什么时候在需要时使用这些排序规则,例如,
这样的名字的表格
[id - name]
它只会包含来自不同语言的名称字符,例如 法语、德语、拉丁语。 . .
对于这样的表,我是使用utf8mb_bin 的排序规则还是坚持使用utf8mb4_unicode_520_ci,
另一方面,例如博客主题的表格:
[id - title - subject]
我是把所有的列归类到utf8mb4_unicode_520_ci还是使用:
utf8mb_bin 为title
utf8mb4_unicode_520_ci 为subject
据我了解,utf8mb4_unicode_520_ci 中包含一些可用于博客主题的表情,还是我只是忽略所有内容而只使用utf8mb4_unicode_520_ci?
但总的来说,使用这些不同的排序规则有什么意义?它们如何影响我在SELECT 查询中的结果?
我想在 berif 中了解的是:
每个使用什么排序规则:
- 名字
- 标题
- 主题
- 电子邮件
- 个人简介
- 消息
- 用户名
【问题讨论】:
-
stackoverflow.com/questions/2344118/utf-8-general-bin-unicode 的副本——其中谈到了
utf8;但是,utf8mb4和utf8与此问题具有相同的特征。
标签: mysql character-encoding collation utf8mb4