【发布时间】:2012-10-23 16:56:22
【问题描述】:
我想检索网页中的文本作为字符串。这可能吗? 我是 Javascript 新手。
例如:
var url = "http://en.wikipedia.org/wiki/Programming";
var result = url.getText(); <---- stores text as a string
document.write(result);
如何编写 getText 方法?以太整个 HTML 源代码(我可以用它来获取文本)或只是文本。我想在网络浏览器中执行此操作。
我试过了,我可以得到一个索引号:
var url = "http://www.youtube.com/results?search_query=cat&page=2";
var result;
function go(){
result = url.search(/cat/i);
document.write(result);
}
这给了我一个 44 的索引。这意味着阅读一个页面是可能的。我可以反其道而行之,输入索引来检索文本吗?
【问题讨论】:
-
你的意思是整个 HTML 源代码?
-
您是希望在 Web 浏览器中执行此操作,还是从 Node.js 或 Rhino 等服务器端 JS 引擎执行此操作?
-
为了解决跨域问题,是否可以运行代理服务?
标签: javascript html dom text web