【发布时间】:2017-09-11 17:50:13
【问题描述】:
我认为[^0-9a-zA-Z]* 不包括所有字母数字字母,但允许特殊字符、空格等。
使用搜索字符串 [^0-9a-zA-Z]*ELL[^0-9A-Z]* 我希望输出如下
ELL
ELLs
The ELL
Which ELLs
但是我也得到以下输出
Ellis Island
Bellis
如何解决这个问题?
【问题讨论】:
-
@WiktorStribiżew 正则表达式应该捕获“ELL”和“ELLs”
-
为什么要捕获这些子字符串?为什么不只是匹配?预期输出是什么?
-
@WiktorStribiżew 它是 python 程序的一部分,它读取文件名并根据关键字分配类别。
ELL、ELLs、_ELL-、ELLs--等将被分配一个类别。有时 ELL 和 ELL 周围有非字母数字字符,Regex 应考虑到这一点。 -
@WiktorStribiżew 仍在努力解决这个问题,即它没有捕获“ELLs”或
_ELLs
标签: regex