【发布时间】:2016-04-03 00:53:24
【问题描述】:
所以对于这个大学项目,我正在创建一个应用程序,它使用 API 以某种方式检索数据、存储和输出。
但我意识到 API 非常原始,并没有提供所需的适当数据。
因此,我现在需要你的帮助来解决我什至不知道它叫什么的东西。
我需要一种技术来读取网页并返回请求网页的 HTML,因此我可以创建一个算法来自己提取适当的数据。
我知道,如果它是我自己的网站,我可以使用 javascript 来执行以下操作:
var unfilteredData = document.getElementbyId("x");
> 或
var unfilteredData = document.getElementbyId("x"),innerHtml;
但我需要知道如何访问不在我域中的网站(元素/标签)。
仅供参考,我知道 JSON、AJAX、XHttpRequest 或任何您想称呼它的名称:
function loadKnownXML() {
var xmlhttp;
if (window.XMLHttpRequest) {
xmlhttp = new XMLHttpRequest();
}
xmlhttp.onreadystatechange = function() {
if (xmlhttp.readyState == 4 && xmlhttp.status == 200) {
document.getElementById("demo").innerHTML =
xmlhttp.responseText;
}
};
xmlhttp.open("GET", "xmlhttp_info.txt", true);
xmlhttp.send();
}
但是,这些 xhttprequest 仅适用于 API 等。
我需要输入“http://www.bbc.com/”的东西,它会给我 BBC 网站的(整个)HTML 页面。
【问题讨论】:
标签: html apache api tomcat glassfish