【问题标题】:How to find only the content of a specific HTML tag using c++?如何使用 c++ 仅查找特定 HTML 标记的内容?
【发布时间】:2016-04-04 13:50:22
【问题描述】:

我正在编写一个程序,其中string 我有一个HTML 页面 的代码。现在,我需要获取<article> 标记之间的文本。我的html页面包含多个article标签,所以我需要获取不同article标签的文本

文章标签的一个例子是:

<article class="item" data-recipe="119726">
        <a class="loopimg pvideo" href="http://www.cookaround.com/ricetta/pasta-frolla-4.html" title="Leggi: Pasta frolla"><img src="http://cdn.cook.stbm.it/thumbnails/ricette/119/119726/hd400x225.jpg" alt="Leggi: Pasta frolla" /></a>
        <h3><a href="http://www.cookaround.com/ricetta/pasta-frolla-4.html" title="Leggi: Pasta frolla">Pasta frolla</a></h3>
        <ul><li>Difficoltà <span>bassa</span></li><li class="costo">Costo <span>basso</span></li><li>Realizzazione <span>10 min</span></li></ul>
    </article>

所以,我需要获取每个文章标签title="Leggi: Pasta frolla",其中title对于每个标签都是不同的。

如何使用 c++ 做到这一点?

【问题讨论】:

  • 你试过std::string::findstd::string::substring吗?
  • 但是对于多个文章标签?我的文章标签数量未定义@NathanOliver
  • 将查找作为while循环的条件。
  • @NathanOliver 怎么样?哪个变量?

标签: html c++ tags html-parsing html-parser


【解决方案1】:

我会推荐使用Boost,一个非常强大的库。

也许你看看这个问题 Parsing XML Attributes with Boost,应该可以解决你的问题。

【讨论】:

  • 如何在 Visual Studio 2015 中添加 Boost? @Cr3at0rX
  • 在谷歌上的快速搜索给了我这个link
  • 但如果没有 xml 文件而是包含 html 代码的字符串?但是感谢链接@Cr3at0rX
  • 使用搜索功能即可。 stackoverflow.com/questions/5289086/…
  • 我尝试使用它,但是...如果我读取包含整个 html 代码的字符串,我会显示此错误:expected = 有什么问题? @Cr3at0rX
猜你喜欢
  • 2012-12-20
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-03-16
  • 2012-04-11
  • 2019-06-24
  • 2011-04-17
  • 2018-12-23
相关资源
最近更新 更多