【发布时间】:2011-07-02 03:30:47
【问题描述】:
我有一个看起来像这样的文件:
<table name="content_analyzer" primary-key="id">
<type="global" />
</table>
<table name="content_analyzer2" primary-key="id">
<type="global" />
</table>
<table name="content_analyzer_items" primary-key="id">
<type="global" />
</table>
我需要提取name= 后面的引号内的任何内容,即content_analyzer、content_analyzer2 和content_analyzer_items。
我在 Linux 机器上执行此操作,因此使用 sed、perl、grep 或 bash 的解决方案很好。
【问题讨论】:
-
不用害羞,欢迎光临!
-
感谢大家提供有用的 cmets。对于 XML 格式不正确,我深表歉意。为了简化,我删除了一些标签。
标签: regex perl sed html-parsing text-extraction