【发布时间】:2011-07-09 13:06:07
【问题描述】:
我会直接说:我有一个这样的字符串(但有数千行)
Ach-emos_2
Ach. emos_54
Achėmos_18
Ąžuolas_4
Somtehing else_2
我需要删除与a-z 和ąčęėįšųūž 加上_ 加上any integer 不匹配的行(第 3 和第 4 行与此匹配)。这应该不区分大小写。我认为正则表达式应该是
[a-ząčęėįšųūž]+_\d+ #don't know where to put case insensitive modifier
但是应该如何看待匹配非 alpha(和立陶宛字母)加上下划线加整数的行的正则表达式?我试过了
re.sub(r'[^a-ząčęėįšųūž]+_\d+\n', '', words)
但不好。
提前致谢,如果我的英语不太好,请见谅。
【问题讨论】: