【发布时间】:2010-12-23 09:19:46
【问题描述】:
假设我有:
my $string = "one.two.three.four";
我应该如何使用上下文来获取模式找到匹配项的次数 (3)?这可以使用单线完成吗?
我试过了:
my ($number) = scalar($string=~/\./gi);
我认为通过在$number 周围加上括号,我会强制数组上下文,通过使用scalar,我会得到计数。但是,我得到的只是1。
【问题讨论】:
假设我有:
my $string = "one.two.three.four";
我应该如何使用上下文来获取模式找到匹配项的次数 (3)?这可以使用单线完成吗?
我试过了:
my ($number) = scalar($string=~/\./gi);
我认为通过在$number 周围加上括号,我会强制数组上下文,通过使用scalar,我会得到计数。但是,我得到的只是1。
【问题讨论】:
这将正则表达式本身置于标量上下文中,这不是您想要的。相反,将正则表达式放入列表上下文中(以获取匹配数)并将 that 放入标量上下文中。
my $number = () = $string =~ /\./gi;
【讨论】:
() = $string =~ /\./gi,使匹配运算符在列表上下文中返回匹配结果。这类似于my @results = $string =~ /\./gi;。接下来,my $number 部分是一个标量值。将列表上下文的结果分配给标量会返回其长度。这与my $count = @some_list 相同,返回数组的长度。我在下面的回答是另一种可视化行为的方式。
我认为描述这一点最清晰的方法是避免立即转换为标量。首先分配给一个数组,然后在标量上下文中使用该数组。这基本上就是 = () = 成语会做的事情,但没有(很少使用的)成语:
my $string = "one.two.three.four";
my @count = $string =~ /\./g;
print scalar @count;
【讨论】:
@count 周围的括号是不必要的。
另外,请参阅Perlfaq4:
有多种方法,效率各不相同。如果您想计算字符串中某个单个字符 (X) 的计数,可以使用 tr/// 函数,如下所示:
$string = "ThisXlineXhasXsomeXx'sXinXit"; $count = ($string =~ tr/X//); print "There are $count X characters in the string";如果您只是在寻找单个字符,这很好。但是,如果您尝试计算较大字符串中的多个字符子字符串,则 tr/// 将不起作用。您可以做的是围绕全局模式匹配包装一个 while() 循环。例如,让我们计算负整数:
$string = "-9 55 48 -2 23 -76 4 14 -44"; while ($string =~ /-\d+/g) { $count++ } print "There are $count negative numbers in the string";另一个版本在列表上下文中使用全局匹配,然后将结果分配给一个标量,产生匹配数的计数。
$count = () = $string =~ /-\d+/g;
【讨论】:
下面的代码是单行代码吗?
print $string =~ s/\./\./g;
【讨论】:
试试这个:
my $string = "one.two.three.four";
my ($number) = scalar( @{[ $string=~/\./gi ]} );
它为我返回3。通过创建对数组的引用,正则表达式在列表上下文中进行评估,@{..} 取消引用数组引用。
【讨论】:
我注意到,如果您的正则表达式中有 OR 条件(例如 /(K..K)|(V.AK)/gi ),则生成的数组可能包含未定义的元素,这些元素包含在最后的计数中。
例如:
my $seq = "TSYCSKSNKRCRRKYGDDDDWWRSQYTTYCSCYTGKSGKTKGGDSCDAYYEAYGKSGKTKGGRNNR";
my $regex = '(K..K)|(V.AK)';
my $count = () = $seq =~ /$regex/gi;
print "$count\n";
给出的计数值为 6。
我在这篇文章中找到了解决方案 How do I remove all undefs from array?
my $seq = "TSYCSKSNKRCRRKYGDDDDWWRSQYTTYCSCYTGKSGKTKGGDSCDAYYEAYGKSGKTKGGRNNR";
my $regex = '(K..K)|(V.AK)';
my @count = $seq =~ /$regex/gi;
@count = grep defined, @count;
my $count = scalar @count;
print "$count\n";
然后给出三个正确答案。
【讨论】:
另一种方式,
my $string = "one.two.three.four";
@s = split /\./,$string;
print scalar @s - 1;
【讨论】:
my $count = 0;
my $pos = -1;
while (($pos = index($string, $match, $pos+1)) > -1) {
$count++;
}
用 Benchmark 查了一下,速度挺快的
【讨论】:
Friedo 的方法是:$a = () = $b =~ $c。
但可以将其进一步简化为 ($a) = $b =~ $c,如下所示:
my ($matchcount) = $text =~ s/$findregex/ /gi;
感谢您将它封装在一个函数中,getMatchCount(),而不必担心它会破坏传递的字符串。
另一方面,您可以添加一个交换,这可能需要更多的计算,但不会导致更改字符串。
my ($matchcount) = $text =~ s/($findregex)/$1/gi;
【讨论】: