- Perl中,
$Fahrenheit和$Celsius之类的普通变量一般以$开头,可以保存一个数值或者任意长度的文本。 -
if ($reply =~ m/^[0-9]+$/),m/…/代表尝试进行“正则表达式匹配”。=~用来连接正则表达式和待搜索的目标字符串,左侧返回值是true&false。 括号没有改变正则表达式意义,但把括号内的数据保存了下来。
$celsius =~ m/^[-+]?[0-9]+[CF]$/、$celsius =~ m/^([-+]?[0-9]+)([CF])$/两个代码意义一样。捕获型括号:
- 非捕获型括号
(?…),例如$celsius =~ m/^([-+]?[0-9]+)([CF])$/,即使[CF]两端的括号排在第三位,它匹配的文本也会保存在$2中,因为(?…)不会影响捕获计数。 -
\b在正则表达式中匹配一个单词的分界符,但在字符组中,它匹配一个退格符。 - 用
\s匹配所有”空白”。 -
i称作修饰符,把它放在m/…/结构之后,告诉Perl进行不区分大小写的匹配,不是正则表达式的一部分,是m/…/结构的一部分。例如:$input =~ m/^([-+]?[0-9]+(\.[0-9]+)?)\s+([CF])$/i -
/g也是m/…/结构的一部分,进行全局操作。不是正则表达式的一部分。 - 可以用
^/s*$检查空行。 -
.*通常用来表示“一组任何字符”,但其中会有陷阱。 - 环视不会占用字符,它只能寻找到能够匹配的位置。
(?=Jeffrey)Jeff和Jeff(?=rey)是等价的。 - 查找和替换。格式和信息匹配类似
$var =~ m/rege x/,此格式为$var =~ s/rege x/replacement/,如果正则表达式能够匹配$var中的某段文本,则将这段匹配的文本替换为replacement。 -
再来几个顺序环视的例子:要求把所有“Jeffs”替换为“Jeff’s”。不使用环视
s/Jeffs/Jeff's/g或更好的s/\bJeffs\b/Jeff's/g,\b为界符,不容易匹配到错误的单词。复杂些的表达式s/\b(Jeff)(s)\b/$1'$2/g,简单的s/\bJeffs\b/Jeff's/g,正则表达式表示方式s/\bJeff(?=s\b)/Jeff'/g。
这几种方式的比较:
三种表达方式比较:
匹配【Jeffrey】里面的【Jeff】
匹配右侧紧跟着是【s\b】的【Jeff】字符串
匹配左侧为【\b Jeff】右侧为【s \b】的字符位置前两个正则表达式匹配的都是一个字符串,第三个匹配的是一字符个位置。
四种类型的环视
- 一次迭代完成时,下一次的迭代会在上一次匹配的终点开始尝试。使用顺序环视的意义在于,检查某个位置,单间差时匹配的字符并不算在(最终)“匹配的字符串”内。
相关文章: