【问题标题】:Regular expression for Google Script - Fetched HTMLGoogle 脚本的正则表达式 - 提取的 HTML
【发布时间】:2017-06-19 10:18:11
【问题描述】:

我有一个从 URL 获取内容的 Google 脚本。我正在使用正则表达式来查找我需要抓取的内容,例如:

var htmlSubCategory = UrlFetchApp.fetch(url).getContentText();    
var regexpFindingAllLinks = /<div class="small-12 medium-5 large-4 columns"><a href="\/(.*?)\//g
var linksProducts = regexpFindingAllLinks.exec(htmlSubCategory);

我在编写其他正则表达式以查找某些项目的标题时遇到问题。源代码如下所示:

<p class="heading"><span class="highlight-ico"></span><a href="/url-1/" title="some title for URL 1">Title I need to grab</a></p>
<p class="heading"><span class="highlight-ico"></span><a href="/url-2/" title="some title for URL 2">Title I need to grab</a></p>

我基本上需要一个正则表达式来查找

<p class="heading"><span class="highlight-ico"></span><a href="(can be any content)" title="(can be any content)">(grab this content)</a></p>

其次,我想要一个只获取参考数字的正则表达式,如下所示:X12345678,其中 X 是一个字母,后跟 8 位数字。

我是这些脚本的新手,如有任何帮助,将不胜感激。

【问题讨论】:

  • 哦,我的错,评论已删除:p
  • 问题帖应该只有一个问题。

标签: javascript regex google-apps-script google-sheets


【解决方案1】:

shouldn't use regex to parse HTML,但如果你不能用其他方法,就用这个:

/<p class="heading"><span class="highlight-ico"><\/span><a href="[^"]*" title="[^"]*">((?:(?!<\/a>).)*)<\/a><\/p>/

对于您的第二个问题(匹配参考编号),请使用:

/X\d{8}/

【讨论】:

    猜你喜欢
    • 2010-09-15
    • 2017-07-16
    • 1970-01-01
    • 2011-12-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-27
    • 2021-12-26
    相关资源
    最近更新 更多