【发布时间】:2015-02-19 10:04:38
【问题描述】:
我不是程序员,我只是发现这个网站适合问我的问题,所以请试着像帮助初学者一样帮助我。 (不过我对 c 和 php 和 html 有一点了解)
这是我的问题
我已将网页的源代码保存在例如“source.txt”文件中,现在我想查找文本中位于<h4> 和</h4> 之间的所有单词。我需要一个命令来打开“source.txt”然后查找这两个短语之间的单词并将每个单词保存在不同的行中,最后将它们保存在例如“result.exe”中
例如我有:
<h4>Barton Fink</h4></a>what is your name<br /><h4>Flyer123</h4></a>my name is pimp<br /><h4>mr.jaghi</h4></a>LoL<br />
我希望我的输出是:
巴顿芬克
传单 123
贾吉先生
确保它很容易用短代码手动完成,但在我的例子中,它的页面很长,需要提取数千个这样的单词
顺便说一句,我正在使用 Windows 平台,如果可能,请告诉我一种使用 cmd 的方法,或者如果没有,请告诉我最简单的方法
【问题讨论】:
-
你有任何代码显示你自己尝试过吗?在这里帮助解决代码问题。不给你写程序。
-
不幸的是,如果我问错了问题,或者问错了地方,我不会感到抱歉,但我想不出其他地方,这对我来说很重要。我希望这个体面的网站的一些天才成员可以帮助我。