【发布时间】:2019-03-07 23:23:35
【问题描述】:
我想抓取页面https://www.reddit.com/search?q=Expiration&type=link&sort=new上所有问题的链接和标题。元素具有以下结构:
<a data-click-id="body" class="SQnoC3ObvgnGjWt90zD9Z" href="/r/excel/comments/ayiahc/calculating_expiration_dates_previous_solution_no/">
<h2 class="s1okktje-0 cDxKta">
<span style="font-weight:normal">Calculating Expiration Dates - Previous Solution No Longer Works</span>
</h2>
</a>
我使用questions = driver.find_elements_by_xpath('//a[@data-click-id="body"]') 获取问题,然后通过for 对其进行迭代。我可以使用question.get_attribute('href') 来获取链接。
但是,我不知道如何提取 span 中的标题(来自 question)。
有人知道怎么做吗?
【问题讨论】:
标签: python selenium selenium-webdriver webdriver webdriverwait