【问题标题】:Matching several items inside one string with preg_match_all() and end characters使用 preg_match_all() 和结束字符匹配一个字符串中的多个项目
【发布时间】:2010-04-04 16:50:27
【问题描述】:

我有以下代码:

preg_match_all('/(.*) \((\d+)\) - ([\d\.\d]+)[,?]/U',
    "E-Book What I Didn't Learn At School... (2) - 3525.01, FREE Intro DVD/Vid (1) - 0.15",
    $match);
var_dump($string, $match);

并得到以下输出:

array(4) {
  [0]=>
  array(1) {
    [0]=>
    string(54) "E-Book What I Didn't Learn At School... (2) - 3525.01,"
  }
  [1]=>
  array(1) {
    [0]=>
    string(39) "E-Book What I Didn't Learn At School..."
  }
  [2]=>
  array(1) {
    [0]=>
    string(1) "2"
  }
  [3]=>
  array(1) {
    [0]=>
    string(7) "3525.01"
  }
}

只匹配一个项目...我需要的是从这些字符串中获取所有项目。当我在字符串末尾添加“,”符号时 - 它工作正常。但是在每个字符串中添加逗号是没有意义的。有什么建议吗?

【问题讨论】:

    标签: php regex pcre


    【解决方案1】:

    试试这个正则表达式:

    (.*?)\s*\((\d+)\)\s*-\s*(\d+\.\d+)(?:,\s*)?
    

    主要区别在于您有 .*(贪婪),我将其替换为 .*?(不贪婪)。您首先“吃掉”整个字符串(换行符除外),然后回溯以匹配字符串中的一个片段。

    演示:

    preg_match_all('/(.*?)\s*\((\d+)\)\s*-\s*(\d+\.\d+)(?:,\s*)?/',
        "E-Book What I Didn't Learn At School... (2) - 3525.01, FREE Intro DVD/Vid (1) - 0.15",
        $matches, PREG_SET_ORDER);
    print_r($matches);
    

    产生:

    Array
    (
        [0] => Array
            (
                [0] => E-Book What I Didn't Learn At School... (2) - 3525.01, 
                [1] => E-Book What I Didn't Learn At School...
                [2] => 2
                [3] => 3525.01
            )
    
        [1] => Array
            (
                [0] => FREE Intro DVD/Vid (1) - 0.15
                [1] => FREE Intro DVD/Vid
                [2] => 1
                [3] => 0.15
            )
    
    )
    

    【讨论】:

    • 但是逗号怎么办?看第二项
    • @nefo_x 使用了/U 修饰符,这使得量词默认为非贪婪的。这正是您应该使用该修饰符的原因;它不可避免地引起的混乱超过了任何好处。如果您希望量词是非贪婪的,请添加 ?
    • @Alan,啊,我以为它与Unicode有关,但我想这是一个小写的u。谢谢。
    猜你喜欢
    • 2010-11-04
    • 2022-01-19
    • 1970-01-01
    • 2015-08-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-11-03
    相关资源
    最近更新 更多