【发布时间】:2010-12-23 16:36:05
【问题描述】:
你好 通常我必须用 php 导入 xml 文件,但这些文件包含一些奇怪的字符,例如:\u2022(对应于 • real char)、\u2019 等。 php 中是否有任何函数可以将此字符转换为它们各自的真实字符(例如 \u2022-> •)?
【问题讨论】:
-
似乎找到了使用 base64.encode/decode 的解决方案。
标签: php unicode-string
你好 通常我必须用 php 导入 xml 文件,但这些文件包含一些奇怪的字符,例如:\u2022(对应于 • real char)、\u2019 等。 php 中是否有任何函数可以将此字符转换为它们各自的真实字符(例如 \u2022-> •)?
【问题讨论】:
标签: php unicode-string
我假设您想修复构建不佳的第三方 XML 中的错误,而您无法控制。没有真实样本很难说,但 \u2019 是用于编码 Unicode 字符的 JavaScript 语法。鉴于此,您可以将输入处理为 JavaScript 字符串而不是纯文本。 json_decode() 函数可以帮助你:
<?php
$input = '\u2022 (corresponding to • real char ) , \u2019';
$output = json_decode('"' . $input . '"');
现在$output 包含• (corresponding to • real char ) , ’。
【讨论】: