【发布时间】:2012-02-05 18:23:09
【问题描述】:
如果我们正在尝试将类似的推文存储到数据库中,请参阅此tweet 和以下thread。我无法在 MySQL 中存储这条推文,我想知道如何识别字符串中是否包含 utf8-mb4 字符集无法处理的字符,以便避免存储它。
【问题讨论】:
-
你误会了,
utf8-mb4可以存储当前支持的所有 Unicode 字符。重新阅读提到的问题。 -
mb4 对我还是不起作用,我该怎么办?
-
您确定问题出在 MySQL 上吗?也许它与 MySQL 驱动程序或类似的驱动程序有关。
-
MySQL 说它愿意在这样的字符串中存储什么?只有 8 位 ASCII 码?在这种情况下,测试很容易。如果 MySQL 愿意存储 Unicode,你应该没有问题。如果它存储其他东西......Unicode定义了各种各样的字符类,以及一些实现相应谓词的工具(我们有一个但不容易从MySQL环境访问),因此可以决定任何字符代码如果它属于这样的 Unicode 类。
-
您的表格的默认字符集和文本字段是否设置为 utf8mb4?
标签: java encoding utf-8 character-encoding