【发布时间】:2012-04-16 05:32:55
【问题描述】:
我需要使用正则表达式处理我的 php 脚本中的字符串。但是有一个问题——不同的字符串有不同的编码。如果字符串只包含 ascii 符号,mb_detect_encoding 函数返回 'ASCII'。但如果字符串包含俄语符号,例如,mb_detect_encoding 返回 'UTF-8'。我想手动检查每个字符串的编码并不是一个好主意。
所以问题是 - 对 ascii 字符串使用 preg_replace (带有 unicode 修饰符)是否正确?为 ascii 和 utf-8 字符串编写这样的代码preg_replace ("/[^_a-z]/u","",$string); 是否正确?
【问题讨论】:
标签: php regex unicode preg-replace ascii