【发布时间】:2012-12-18 18:02:15
【问题描述】:
我正在尝试对 XML 文件(准确地说是 Jira 导出文件)运行正则表达式,以解决其中的一些 JQL 查询问题。
我正在寻找一个名为“request”的属性,它包含一个查询。在该查询中,用户名需要包含在 HTML 实体中以获取引号 ("quot;)。 用户名总是跟在字符串 "reporter = '、"assignee = " 或 "watcher = " 之后,除了一种特殊情况:字符串 currentUser() 不是用户名,不需要替换。
Original:
<SearchRequest id="10000" name="Example" author="myusername" user="myusername" request="reporter = anotheruser and status != Closed" favCount="1"/>
Result:
<SearchRequest id="10000" name="Example" author="myusername" user="myusername" request="reporter = "anotheruser" and status != Closed" favCount="1"/>
Search:
(request=".*?(reporter|assignee|watcher) = )(?!currentUser)([a-z.]+)(.*?")
Replace:
$1&$3&$4
这已经在 SublimeText 2 和Regex Tester 2 中进行了尝试和测试,并且可以正常工作。如您所见,它使用前瞻来检测 currentUser 的否定情况。现在,当我尝试在 Sed 中使用这个正则表达式时,它会出错:
$ sed -i '' -E 's/(request=".*?(reporter|assignee|watcher) = )(?!currentUser)([a-z.]+)(.*?")/$1&$3&$4/g' entities.xml
sed: 1: "s/(request=".*?(reporte ...": RE error: repetition-operator operand invalid
我不知道现在该怎么做,因为 sed 对我来说是一个新领域。我倾向于认为这是导致此问题的前瞻。也许有更简单的方法来满足这个要求?
【问题讨论】:
-
首先,在sed中,不是$1,$2,...而是\1,\2,...
-
另外,我不确定你的意思是什么:“。*?”。点星搜索 0 到多次出现的任何内容。问号是怎么回事?
-
@StefanosKalantzis
.*是贪婪的,问号使它变得懒惰.*?。 -
正如sudo_O所说,是为了让匹配变得懒惰。 searchRequest 中有更多的属性。如果没有惰性匹配,匹配会一直运行到最后一个属性的右引号。