使用 Web::Scraper 从元素的内容中提取文本和 HTML

【问题标题】：Extracting text and HTML from the contents of an element using Web::Scraper使用 Web::Scraper 从元素的内容中提取文本和 HTML
【发布时间】：2016-02-11 12:40:04
【问题描述】：

给定以下 HTML sn-p：

<span itemprop="streetAddress">59 Court St.<br>City Hall</span>

我想提取span 的内容，包括<br> 标签。我可以使用以下内容提取文本：

 process 'span[itemprop="streetAddress"]', address => 'TEXT';

但这忽略了<br> 标签。

【问题讨论】：

标签： perl web-scraping

【解决方案1】：

好的，我破解了Web::Scraper的源代码，看到你可以将第二个参数的值设置为'RAW'，如下所示：

process 'span[itemprop="streetAddress"]', address => 'RAW';

【讨论】：