【发布时间】:2017-06-08 09:51:24
【问题描述】:
首先,我想解析一个 html 并获取一些行
使用 Google Apps 脚本,它已显示
" 元素类型 "link" 必须以匹配的结束标签 "/link " " 结束
这里是代码
var response = UrlFetchApp.fetch(url)
var downloadContent = response.getContentText();
var doc = XmlService.parse(downloadContent);
我认为因为html使用html5,GAS无法解析,
所以我尝试了其他方法来解析字符串, (逐行阅读并保留我需要的行)
var xml = UrlFetchApp.fetch(url).getContentText();
但是 GAS 没有 Scanner,我该怎么办?
其实我想去这个网址“https://www.ptt.cc/bbs/gossiping/index.html”
并在
中获取信息<div class="r-ent">
...
</div>
【问题讨论】:
-
您可能会发现 Spencer Easton 的新库对解析 HTML 很有用:github.com/Spencer-Easton/Apps-Script-htmlparser2-library
-
我会关注这个 git,谢谢! @安德鲁罗伯茨
标签: javascript html parsing google-apps-script fetch