https://github.com/michaeljamesfitzgerald/Introducing-Regular-Expressions 下载rime-inro.txt
notepad++使用正则表达式查询
使用notepad++打开rime-inro.txt,ctrl+F,勾选“正则表达式”,如下图:
匹配数字字符
图中的正则表达式分别为:[01],[0-3],\d,匹配结果在下方用黄色高亮。
匹配非数字字符
如图,使用表达式[^0-9]可以匹配所有的非数字字符,文中一共有532个字符,匹配到的结果是528,因此为匹配到的是文中的四个数字字符。
匹配非数字字符,还可以使用\D或者[^\d],效果同上。^取反,字符组取反,则意味着不匹配这些(匹配出这些意外的内容)。
匹配单词字符
\w匹配字母、数字、下划线,而\D还匹配空格、标点符号等数字字符以外的一切字符。\W大写W,匹配非单词字符。
匹配空白符
\s可以匹配空格、制表符、换行符、回车符,与其匹配内容相同的表达式为:[ \t\r\n]\f匹配换页符\h水平空白符\v垂直制表符
以上均有对应的大写字母表达式,直白的理解就是大写与小写表达式,是取反的效果。
匹配任意字符
.、.*、.+的匹配结果各有不同:.匹配了除结束符以外的所有字符,.*匹配了第一行的所有字符,.+匹配了第一行的所有字符。
给文本添加标签
选中开头单词字符为大写T,到结束符之间的所有字符,在捕获的第一个分组外围添加一个一级标题的html标签: