【发布时间】:2020-04-13 02:59:01
【问题描述】:
这是我正在查看的页面:https://www.nytimes.com/topic/destination/russia
我已导入 BeautifulSoup 和请求。我想创建一个包含此页面所有标题的文本文件。我可以得到其中一个,使用
from bs4 import BeautifulSoup
import requests
source = requests.get('https://www.nytimes.com/topic/destination/russia').text
soup = BeautifulSoup(source, 'lxml')
headline = soup.find('h2').get_text()
print(headline)
产生:
When an Oil Price War Meets Coronavirus Fears, Markets Get Punched in the Face
一切都好。但是,我完全不知道如何遍历和收集页面中的所有标题。任何帮助将不胜感激。
【问题讨论】:
-
这能回答你的问题吗? Python beautifulsoup iterate over table
-
你能澄清一下到底是什么问题吗?听起来你只需要学习如何使用 BeautifulSoup。
-
我的回答对你有帮助吗?如果是这样,请不要忘记单击我的答案旁边的勾:)
标签: python html web-scraping