使用 Python 检索 javascript 文件内容答案

【问题标题】：Retrieving javascript file content with Python使用 Python 检索 javascript 文件内容
【发布时间】：2017-01-10 18:19:11
【问题描述】：

我需要使用 Python 检索 JavaScript 文件内容。我想也许requests 可以解决问题——也许可以，但它要么不像我想象的那么简单，要么我做错了什么。

import requests
s = requests.Session()
r = s.get(link)

我得到的回应是

<HTML><HEAD>
<TITLE>Invalid URL</TITLE>
</HEAD><BODY>
<H1>Invalid URL</H1>
The requested URL "&#91;no&#32;URL&#93;", is invalid.<p>
Reference&#32;&#35;9&#46;3e1151c8&#46;1484072058&#46;308a223a
</BODY></HTML>

我需要的和这段代码在php中做的一样，

$ch = curl_init();      
curl_setopt($ch, CURLOPT_URL, $link);
$html = curl_exec($ch);

【问题讨论】：

"我需要的和这段代码在php中的作用是一样的，"这是什么意思？你是在问 Python 代码是否会和 PHP 代码做同样的事情？
我认为它会做同样的事情，但事实并非如此，或者我做错了什么。如何获取带有请求或其他 python 库的 javascript 文件内容？
我无法回答您的问题，只能澄清一下。
我在行的中间初始化了标题和其他内容，这可能是问题，因为使用新的请求对象它正在工作，谢谢！

标签： javascript python web-scraping python-requests

【解决方案1】：

你需要做一个http get请求

import urllib2
link = "http://whatever.com/your-file.js"
urllib2.urlopen(link).read()

php 代码使用 curl 做的比看起来要多很多

【讨论】：