【发布时间】:2009-12-10 09:43:03
【问题描述】:
我希望检索网站的来源,该来源是在单击链接时动态生成的。链接本身如下:
<a onclick="function(); return false" href="#">Link</a>
这使我无法直接查询允许我获取动态生成的网站 (urllib/2) 的 URL。
如何通过 python 检索使用上述函数(在 HTML 中)生成的网站的源代码?有没有办法绕过return false" href="#"?或者完全是onclick,然后获取实际的URL?
如果有其他方法可以从上面的抽象链接生成网站,以便可以从python中的urllib中获取,请参考。
编辑:
我概括了上面看到的代码 - 但是有人告诉我,必须对特定的 javascript 进行逆向工程才能使用它。
链接到 .js - http://a.quizlet.com/j/english/create_setku80j8.js
链接到网站的链接:
<a onclick="importText(); return false" href="#">Bulk-import data</a>
网站实际网址:http://quizlet.com/create_set/
上述相关.js的美化JS:http://pastie.org/737042
【问题讨论】:
-
我是一名 Quizlet 开发人员。也许您可以告诉我如何提供帮助 :) 我们确实有可用的 API...
标签: javascript python onclick urllib2 urllib