【问题标题】:Find and save all words between 2 specific phrase in a large text file [closed]在大文本文件中查找并保存 2 个特定短语之间的所有单词 [关闭]
【发布时间】:2015-02-19 10:04:38
【问题描述】:

我不是程序员,我只是发现这个网站适合问我的问题,所以请试着像帮助初学者一样帮助我。 (不过我对 c 和 php 和 html 有一点了解)

这是我的问题

我已将网页的源代码保存在例如“source.txt”文件中,现在我想查找文本中位于<h4></h4> 之间的所有单词。我需要一个命令来打开“source.txt”然后查找这两个短语之间的单词并将每个单词保存在不同的行中,最后将它们保存在例如“result.exe”中

例如我有:

<h4>Barton Fink</h4></a>what is your name<br /><h4>Flyer123</h4></a>my name is pimp<br /><h4>mr.jaghi</h4></a>LoL<br />

我希望我的输出是:

巴顿芬克

传单 123

贾吉先生

确保它很容易用短代码手动完成,但在我的例子中,它的页面很长,需要提取数千个这样的单词

顺便说一句,我正在使用 Windows 平台,如果可能,请告诉我一种使用 cmd 的方法,或者如果没有,请告诉我最简单的方法

【问题讨论】:

  • 你有任何代码显示你自己尝试过吗?在这里帮助解决代码问题。不给你写程序。
  • 不幸的是,如果我问错了问题,或者问错了地方,我不会感到抱歉,但我想不出其他地方,这对我来说很重要。我希望这个体面的网站的一些天才成员可以帮助我。

标签: php html c cmd


【解决方案1】:

可以如下,在PowerShell中使用正则表达式。

[regex]::Matches((Get-Content source.txt), "<h4>(.+?)</h4>") | foreach{$_.Groups[1].Value} | OUt-File -FilePath "result.txt"

【讨论】:

  • 工作得像个迷人的 tnx 男人
猜你喜欢
  • 2019-06-12
  • 1970-01-01
  • 2012-10-31
  • 2011-12-17
  • 2017-04-26
  • 1970-01-01
  • 2014-11-05
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多