【发布时间】:2015-06-01 13:45:06
【问题描述】:
1 h
2~1 H
$ {
g
s/<!--([^-]|-[^-]|--+[^->])*-+->|<[^>]*>//g
s/\"/"/g
s/\&/\&/g
s/\</</g
s/\>/>/g
p
}
此 SED 代码从 HTML 文件中删除所有标签和 cmets,但我如何在 AWK 上编写相同的代码? 请帮忙
【问题讨论】:
-
您正在使用
sed解析 HTML 文件,现在您希望 我们 在awk中执行相同的操作。改用合适的解析器怎么样? -
将所有
s///g命令更改为gensub,将s///更改为gsub。只需将它放在一对花括号之间并运行它。在$0上应用 subs 并输出它们。 -
这是 OP 努力的提示,而不是答案。
-
@ShellFish gsub 不等同于
s/// -
你是对的,感谢您指出这一点。 -- 正如User112638726和Kent指出的那样,应该是
sub和gsub。