MySQL utf8mb4编码

MySQL对utf8编码的实现，是以3 byte存的，而不是标准的4 byte，所以编码用到4 byte长度的字符就全部无法存储，典型的，例如emoji。现象是存储emoji时会丢字符，其它符合3 byte存储的字符会保留。utf8mb4编码是对这个问题的修正版编码，是以4 byte存储的。

大家在设计database和table结构时，涉及到不确定内容的存储，推荐都用utf8mb4编码。在database级别指定编码，创建table就不用管编码了，直接继承database的。
栈溢出上的解释：https://stackoverflow.com/questions/30074492/what-is-the-difference-between-utf8mb4-and-utf8-charsets-in-mysql

MySQL utf8mb4编码

另外一个小细节，选择完encoding之后，也要注意collation，例如 utf8_general_ci 和 utf8_bin，xxx_general_ci是大小写不敏感的（Case-Insensitive），xxx_bin是大小写敏感（Binary）。
所以用了general_ci之后，会发现同一列中查询一个"content"，有类似"content" "Content" "CONTENT"的内容被查出来；另外如果用unique key，会发现这一列中“johnny”和“Johnny”被认为是相同的字符串，无法同时存在。