【发布时间】:2016-02-28 21:07:54
【问题描述】:
我正在尝试使用以下方法从 Google 电子表格中的网页获取元素:
function pegarAsCoisas() {
var html = UrlFetchApp.fetch("http://www.saosilvestre.com.br").getContentText();
var elements = XmlService.parse(html);
}
但是我不断收到错误:
第 2 行错误:与元素类型“html”关联的属性名称“itemscope”必须后跟“=”字符。 (第 4 行,文件“”)
我该如何解决这个问题?我想从这个站点获取 H1 文本,但对于其他站点,我必须选择其他元素。
我知道XmlService.parse(html) 方法适用于其他网站,例如维基百科。如您所见here。
【问题讨论】:
标签: javascript google-apps-script web-scraping html-parsing