【发布时间】:2009-07-13 15:19:38
【问题描述】:
我查看了许多有关 cookiejar 的教程,但我的问题是我想转义的网页使用 javascript 创建 cookie,但我似乎无法检索 cookie。有人有解决这个问题的办法吗?
【问题讨论】:
标签: python cookies urllib2 cookiejar
我查看了许多有关 cookiejar 的教程,但我的问题是我想转义的网页使用 javascript 创建 cookie,但我似乎无法检索 cookie。有人有解决这个问题的办法吗?
【问题讨论】:
标签: python cookies urllib2 cookiejar
如果所有页面都使用相同的 JavaScript,那么也许您可以解析 HTML 以找到那段代码,并从中获取 cookie 设置的值?
这会使您的抓取很容易受到第三方网站更改的影响,但在抓取时最常出现这种情况。 (请记住,第三方网站所有者可能不喜欢您以这种方式获取内容。)
【讨论】:
我也回复了你的other question:看看mechanize。它可能是我所知道的功能最全的抓取模块:如果发送了 cookie,那么我相信你可以使用这个模块来获取它。
【讨论】:
也许您可以在带有 Python 绑定(如 python-spidermonkey 或 pyv8)的 JavaScript 引擎中执行 JavaScript 代码,然后检索 cookie。或者,由于 javascript 代码是在客户端执行的,您可以将 cookie 生成代码转换为 Python。
【讨论】: