【问题标题】:Special characters when parsing in PHP在 PHP 中解析时的特殊字符
【发布时间】:2011-12-22 20:14:21
【问题描述】:

我正在用 PHP 解析一个 RSS 提要 - 我的描述/标题包含几个特殊字符,如下所示。

法国大厨——至

我怎样才能清除这个? - 我查看了 strip_tags 等,但这并没有达到目的。查看了 php.net,但没有找到好的/等效的 stripallspecialcharacters($string) - PHP 中有类似的东西吗?谢谢。

【问题讨论】:

  • 为了安全起见:您是否确定提要包含这些字符,或者您只是在 HTML 输出中看到它们?我问是因为它看起来像一个简单的编码问题。
  • @Madmartigan 我们似乎在评论同样的问题???

标签: php parsing rss special-characters


【解决方案1】:

看起来 Regex 是你最好的选择

preg_replace('/[^[:alpha:][:punct:][:digit:]]/u', utf8_encode($input), '');


从之前提出的这个问题中找到了这个
stackoverflow.com/questions/4651899/regex-to-reject-non-english-characters

但是使用正则表达式存在一个问题,它可能适用于您的大多数情况,但并非适用于所有情况,因此您可能想货比三家,寻找一个完全符合您需要的情况。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-04-03
    • 1970-01-01
    • 1970-01-01
    • 2021-12-21
    • 2021-07-16
    • 1970-01-01
    • 2011-05-03
    相关资源
    最近更新 更多