【发布时间】:2015-10-08 20:24:20
【问题描述】:
有没有办法在不加载 mbstring 扩展的情况下检测 PHP 中字符串的编码?我知道使用mb_detect_encoding() 可以做到这一点,但是是否有等效的非多字节函数?
如果没有,实现一个至少可以检测 UTF-8 的 detect_encoding() 函数需要什么?
【问题讨论】:
-
检测编码并不容易。一个仅使用 0-127 个字符的普通 ascii 文件也是一个完全有效的 utf-8 文件,但你不能说它是用 utf 或老式 ascii 构建的,因为两者无法区分。您可以执行诸如查找 BOM 之类的操作,但并非所有文件都有。
标签: php encoding utf-8 multibyte