【发布时间】:2017-01-10 18:19:11
【问题描述】:
我需要使用 Python 检索 JavaScript 文件内容。我想也许requests 可以解决问题——也许可以,但它要么不像我想象的那么简单,要么我做错了什么。
import requests
s = requests.Session()
r = s.get(link)
我得到的回应是
<HTML><HEAD>
<TITLE>Invalid URL</TITLE>
</HEAD><BODY>
<H1>Invalid URL</H1>
The requested URL "[no URL]", is invalid.<p>
Reference #9.3e1151c8.1484072058.308a223a
</BODY></HTML>
我需要的和这段代码在php中做的一样,
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $link);
$html = curl_exec($ch);
【问题讨论】:
-
"我需要的和这段代码在php中的作用是一样的,"这是什么意思?你是在问 Python 代码是否会和 PHP 代码做同样的事情?
-
我认为它会做同样的事情,但事实并非如此,或者我做错了什么。如何获取带有请求或其他 python 库的 javascript 文件内容?
-
我无法回答您的问题,只能澄清一下。
-
我在行的中间初始化了标题和其他内容,这可能是问题,因为使用新的请求对象它正在工作,谢谢!
标签: javascript python web-scraping python-requests