【问题标题】:I am trying to read in a url in python but it is giving an incomplete read我正在尝试在 python 中读取一个 url,但它给出了一个不完整的读取
【发布时间】:2019-07-19 17:24:13
【问题描述】:

我正在尝试在 python 3 中读取一个 url,但是当我尝试它时,它并没有在 URL 中完全变红 这是我的代码

my_url="https://www.newegg.ca/Video-Cards-Video-Devices/Category/ID-38?Tpk=graphics%20cards"

Uclient=uReq(my_url)

page_html=Uclient.read()

【问题讨论】:

  • 使用requests页面加载正常。
  • Andrej Kesley 我确实使用过请求
  • @pelumi 我相信 Andrej 指的是requests 包。
  • 我已经在我的 url 上使用了 requests 函数我只是将其称为 uReq 我正在尝试使用 the(.read) 方法读取 url 但是它给出的读取不完整

标签: python html python-3.x web-scraping urllib


【解决方案1】:

您是否尝试过使用requests 导入它?由于您没有向您展示直接导入,我假设您使用的是urllib.request。下面的代码应该在加载任何 javascript 之前为您提供可用的整个 html 文本(如果是这样的话)

import requests

my_url="https://www.newegg.ca/Video-Cards-Video-Devices/Category/ID-38?Tpk=graphics%20cards"
r = requests.get(my_url)
print (r.text)

【讨论】:

  • 我已经在我的 url 上使用了 requests 函数我只是将其称为 uReq 我正在尝试使用 the(.read) 方法读取 url 但是它给出的读取不完整
  • 嗨@pelumi,有几件事:(1)包请求似乎没有 read() 方法(只有 raw.read())。正如其他用户所指出的,您可能在谈论 urllib.request,它与包 requests 不同(请参阅此线程:stackoverflow.com/questions/2018026/…)。 (2) 话虽如此,即使使用urllib.request.urlopen(my_url).read(),结果仍然与页面源代码中的结果相同,所有html和javascript文本都已解析。您是否正在寻找可能使用 js 加载的任何内容?
猜你喜欢
  • 2020-01-18
  • 2019-03-09
  • 1970-01-01
  • 2021-04-02
  • 1970-01-01
  • 1970-01-01
  • 2023-03-17
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多