【发布时间】:2021-08-09 22:47:15
【问题描述】:
我正在尝试从 2lib.org 抓取下载链接,但由于某种原因,打印的链接不是我手动检查它们时显示的链接。这是我的代码 -
import requests
from bs4 import BeautifulSoup
URL = 'https://2lib.org/book/1844071/8add88/'
page = requests.get(URL)
soup = BeautifulSoup(page.content, 'lxml')
for tag in soup.select('a.btn-primary.dlButton.addDownloadedBook'):
print (f"2lib.org{tag['href']}")
现在,它打印一个以 4da009 结尾的链接,这不是我手动检查站点时得到的链接。我有什么遗漏吗?
谢谢
【问题讨论】:
标签: python web-scraping beautifulsoup python-requests lxml