【问题标题】:Google Scripts - Search HTML by ClassGoogle Scripts - 按类别搜索 HTML
【发布时间】:2018-12-07 20:03:19
【问题描述】:

所以我编写了一个 python 脚本来抓取我的电子邮件中的数据。我使用以下代码按类别查找项目:

HRDataUnClean = str(soup.findAll("h2", {"class": "numbers"}))

这工作得非常好,但是当我使用 GMail 并且有些人抱怨安装 python 和使用 google api 时,我想在 google sheet 中编写一个脚本来执行类似的任务。

我知道如何获取邮件正文:

var html = messages[0].getBody()

但是,这会返回一个字符串,而不是我以前使用 pythons beautifulsoup 时的 html 对象。我找到了谷歌脚本代码来搜索元素类SearchByClass

但是 XmlService.parse(html) 似乎需要一个 html 对象。无论如何我可以将电子邮件正文从字符串转换为 html 对象吗?

【问题讨论】:

标签: google-apps-script google-sheets


【解决方案1】:

在 GAS (2019) 中,没有什么能像在浏览器控制台或 JQUERY 对象中那样的 HTML 表示对象。

XML 服务已被弃用,但它仍然可以工作,并且需要字符串作为输入。

var pageHtmlString = UrlFetchApp.fetch(webAddressUrl);
var doc = Xml.parse(pageHtmlString, true);
var bodyHtml = doc.html.body.toXmlString();
doc = XmlService.parse(bodyHtml);
var root = doc.getRootElement();

注意:如果旧的 Xml.parse 从 Google Scripts 中完全删除,此解决方案可能不起作用。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-10-05
    • 2015-10-13
    • 2021-12-31
    • 2015-11-08
    • 2016-10-22
    • 1970-01-01
    相关资源
    最近更新 更多