【发布时间】:2020-03-02 11:52:56
【问题描述】:
这是我第一次使用网络抓取,所以让我放松一下。我正在尝试从网站中提取“card_tag”。我三次检查了卡片标签是否在他们尊重的标签内,如代码所示。
import requests
from bs4 import BeautifulSoup
result = requests.get("https://www.anime-planet.com/users/mistersenpai/anime/dropped")
src = result.content
soup = BeautifulSoup(src, features="html.parser")
urls = []
for div_tag in soup.find_all('div id="siteContainer"'):
ul_tag = div_tag.find("ul class")
li_tag = ul_tag.find("li")
card_tag = li_tag.find("h3")
urls.append(card_tag)
print(urls)
当我打印 url 列表时,它什么也不输出。您可以通过访问代码中看到的链接并检查“Blood-C”上的元素来查看我正在寻找的东西。如您所见,它列在我要查找的标签中,但我的代码似乎找不到它。 任何帮助将不胜感激。
【问题讨论】:
-
您是否尝试过自己运行处理的每个部分以查看您从哪里开始得到意外结果?
标签: html python-3.x web-scraping beautifulsoup