【发布时间】:2013-03-20 05:15:00
【问题描述】:
我有一个包含 XML 标记的文件。每行都有一个根元素和几个子元素。结构类似于这样
<document><title>some title1</title><abstract>Some abstract1</abstract></document>
<document><title>some title2</title><abstract>Some abstract2</abstract></document>
<document><title>some title3</title><abstract>Some abstract3</abstract></document>
<document><title>some title4</title><abstract>Some abstract4</abstract></document>
现在我必须找到标签包含特定单词的所有行。 eg:获取<abstract>标签内所有包含abstract1的行。
如何在 grep、awk 或 sed 中执行此操作?
【问题讨论】:
-
你想匹配什么?
Some abstract1? -
是的,或者类似
abstract1,但它应该出现在标签内 -
似乎提到this famous question 可能是合适的。