【发布时间】:2019-04-04 11:52:17
【问题描述】:
我正在尝试使用以下代码从 website 中抓取价格数据表;
function scrapeData() {
// Retrieve table as a string using Parser.
var url = "https://stooq.com/q/d/?s=barc.uk&i=d";
var fromText = '<td align="center" id="t03">';
var toText = '</td>';
var content = UrlFetchApp.fetch(url).getContentText();
var scraped = Parser.data(content).from(fromText).to(toText).build();
//Parse table using XmlService.
var root = XmlService.parse(scraped).getRootElement();
}
我从我在类似问题here 中使用的方法中采用了这种方法,但是它在这个特定的 url 上失败并给了我错误;
Error on line 1: Content is not allowed in prolog. (line 12, file "Stooq")
在相关问题here 和here 中,他们谈到不接受提交给解析器的文本内容,但是,我无法将这些问题中的解决方案应用于我自己的问题。任何帮助将不胜感激。
【问题讨论】:
标签: google-apps-script web-scraping html-parsing