【问题标题】:How to save webpage to *.url file using Python [duplicate]如何使用 Python 将网页保存到 *.url 文件 [重复]
【发布时间】:2017-10-19 02:55:47
【问题描述】:

我在 Selenium 中打开了一个网页,我可以访问它的 url,我想将它保存到一个 .url 文件中。该文件将保存,如果您在 vim 中打开它,它会显示 HTML 页面的所有内容(使用下面的第一个实现)。也就是说,当我尝试打开一个对话框时,会出现错误“此 Internet 快捷方式的目标”无效。”有没有办法在 Python 中轻松解决这个问题?

实施 1:

r = requests.get(url, allow_redirects=True)
open('google.url', 'wb').write(r.content)

实施 2:

urllib.request.urlretrieve(url, "google.url")

【问题讨论】:

  • 看起来您正在将 页面内容 写入文件,而不是 url

标签: python selenium selenium-webdriver selenium-firefoxdriver


【解决方案1】:

你可以试试这样的

    headers = your headers
    req = urllib.Request(url, None, headers)
    page = urllib.urlopen(req).read()
    soupdata = BeautifulSoup(page, "html.parser")

我使用 bs4 和 urllib2 作为 urllib 的模块

祝你好运:)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-05-27
    • 2015-03-11
    • 1970-01-01
    • 2015-01-13
    • 2018-05-15
    • 2011-06-18
    • 2011-03-11
    相关资源
    最近更新 更多