【问题标题】:Extracting text and HTML from the contents of an element using Web::Scraper使用 Web::Scraper 从元素的内容中提取文本和 HTML
【发布时间】:2016-02-11 12:40:04
【问题描述】:

给定以下 HTML sn-p:

<span itemprop="streetAddress">59 Court St.<br>City Hall</span>

我想提取span 的内容,包括&lt;br&gt; 标签。我可以使用以下内容提取文本:

 process 'span[itemprop="streetAddress"]', address => 'TEXT';

但这忽略了&lt;br&gt; 标签。

【问题讨论】:

    标签: perl web-scraping


    【解决方案1】:

    好的,我破解了Web::Scraper的源代码,看到你可以将第二个参数的值设置为'RAW',如下所示:

    process 'span[itemprop="streetAddress"]', address =&gt; 'RAW';

    【讨论】:

      猜你喜欢
      • 2023-03-18
      • 2015-11-06
      • 2013-01-15
      • 2019-02-16
      • 2020-11-03
      • 2013-02-21
      • 1970-01-01
      • 2015-11-20
      • 1970-01-01
      相关资源
      最近更新 更多