【发布时间】:2014-02-11 11:55:23
【问题描述】:
我使用 3 个命令(wget/sed/和一个 tr/sort),它们都在命令行中工作,以生成最常用的单词列表。我按顺序使用命令,保存 sed 的输出以在 tr/sort 命令中使用。现在我需要毕业来编写一个结合这 3 个命令的脚本。因此,1) wget 下载一个文件,我将其放入 2) sed -e 's/<[^>]*>//g' wget-file.txt,然后输出 > 转到 3)
cat sed-output.txt | tr -cs A-Za-z\' '\n' | tr A-Z a-z | sort | uniq -c |
sort -k1,1nr -k2 | sed ${1:-100}q > words-list.txt
我知道关于使用正则表达式删除 HTML 标记的问题/争论,但是这 3 个命令目前对我有用。因此,感谢您帮助将其整合在一起。
【问题讨论】:
-
您似乎已经知道如何将输出从一个命令传送到另一个命令。目前还不清楚你在问什么,你还没有在做什么。你可以
wget -O- http://... | sed ... | tr ... -
感谢 larsks,管道输出做到了(并换行 \ 为方便起见)。