【发布时间】:2016-03-02 06:42:53
【问题描述】:
我正在寻找一个在 Notepad++ 中使用的 RegEx,它可以挑选出带有外来词的行。我的策略是尝试捕捉包含外来字符的单词。例如,如果我想找到大写的希腊单词,我已经接近了
^(?< ![a-z0-9]).+\[ΓΣΩΘΦΔΛΠ\](?!=a-z0-9)+$
它试图找到这些大写希腊字母中的任何一个,在小写字母和数字的两侧都有负面的外观,但它不起作用。
如果我制作了一个有效的表达线,例如:
1. BUTTER ΘEΦECOC EGGS
2. Flour CREAM sugar
3. AΘINA HELLAΣ ΠOΘCON
应该只匹配第 1 行和第 3 行,因为第 2 行没有带有希腊字母的单词。
【问题讨论】:
-
也许 [^a-zA-Z\s0-9\.\;\:\,]
-
"Foreign" 不是一个确切的术语 :) 例如,字母 'k' 只出现在意大利语的 'foreign' 单词中。也许您的意思是“常规 ASCII 集之外的字符”?
标签: regex notepad++ unicode-string