【问题标题】:Retrieving javascript file content with Python使用 Python 检索 javascript 文件内容
【发布时间】:2017-01-10 18:19:11
【问题描述】:

我需要使用 Python 检索 JavaScript 文件内容。我想也许requests 可以解决问题——也许可以,但它要么不像我想象的那么简单,要么我做错了什么。

import requests
s = requests.Session()
r = s.get(link)

我得到的回应是

<HTML><HEAD>
<TITLE>Invalid URL</TITLE>
</HEAD><BODY>
<H1>Invalid URL</H1>
The requested URL "&#91;no&#32;URL&#93;", is invalid.<p>
Reference&#32;&#35;9&#46;3e1151c8&#46;1484072058&#46;308a223a
</BODY></HTML>

我需要的和这段代码在php中做的一样,

$ch = curl_init();      
curl_setopt($ch, CURLOPT_URL, $link);
$html = curl_exec($ch);

【问题讨论】:

  • "我需要的和这段代码在php中的作用是一样的,"这是什么意思?你是在问 Python 代码是否会和 PHP 代码做同样的事情?
  • 我认为它会做同样的事情,但事实并非如此,或者我做错了什么。如何获取带有请求或其他 python 库的 javascript 文件内容?
  • 我无法回答您的问题,只能澄清一下。
  • 我在行的中间初始化了标题和其他内容,这可能是问题,因为使用新的请求对象它正在工作,谢谢!

标签: javascript python web-scraping python-requests


【解决方案1】:

你需要做一个http get请求

import urllib2
link = "http://whatever.com/your-file.js"
urllib2.urlopen(link).read()

php 代码使用 curl 做的比看起来要多很多

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-05-31
    • 1970-01-01
    • 1970-01-01
    • 2014-09-12
    • 2017-11-30
    • 2016-03-16
    • 2013-02-03
    • 2014-04-27
    相关资源
    最近更新 更多