【发布时间】:2012-06-19 01:08:50
【问题描述】:
我目前正在编写一个 Android 应用程序,除其他外,它使用来自我不拥有的网站的文本信息。此外,部分页面需要认证。
对于某些页面,我已经能够使用 BasicNameValuePairs 和带有关联对象的 HTTPClient 登录并检索 html 代码。
不幸的是,这些方法无需运行浏览器(甚至是 Android Webview)通常会运行的任何 javascript 函数即可检索网页源代码。我需要其中一些脚本正在检索的文本。
我已经完成了我的研究,但我发现的一切都是猜测并且非常令人困惑。我可以暂时忽略需要登录的页面。此外,我愿意发布任何可能对构建解决方案有用的代码;这是一个独立的项目。
从 javascript 调用中抓取 html 结果的任何具体解决方案?一个例子绝对是一流的。
【问题讨论】:
-
注意:我看到的许多帖子都建议研究“Rhino”,但我还没有找到让它工作的方法。犀牛:mozilla.org/rhino/tutorial.html
标签: javascript android html web-scraping