有没有办法用 yql 获取页面的整个源代码？

【问题标题】：Is there a way to get the entire source of a page with yql?有没有办法用 yql 获取页面的整个源代码？
【发布时间】：2010-11-13 02:49:47
【问题描述】：

我正在尝试将任何页面的源代码加载到仅用于客户端的 html 编辑器的文本框中。我需要能够获取网页的整个来源，而不仅仅是正文。这个 yql 查询只返回正文：

http://query.yahooapis.com/v1/public/yql?format=xml&callback=editor.handleLoad&q=select+*+from+html+where+url%3D%22example.com%22

有没有办法获取完整的源码，或者有其他免费的json-p-x webservices可以吗？

【问题讨论】：

【解决方案1】：

我没有看到使用 YQL 的明显方法，但这里有一个似乎可以工作的 Yahoo Pipe。它拒绝获取他们的 robots.txt 不允许的网站，但它正在获取其他网站的全部源代码：

默认设置为 www.example.com，由于该页面上的 robots.txt 而被拒绝。但是，它接受 URL 作为参数。以下是此管道的示例用法链接，该示例获取管道的来源并返回以 JSON 格式包装的结果：

这有帮助吗？

【讨论】：