【发布时间】:2019-07-20 11:21:57
【问题描述】:
所以我是全新的整个网络抓取的东西。我一直在做一个项目,该项目需要我从here 获得当日消息。我现在已经成功地抓住了这个词,我只需要得到定义,但是当我这样做时,我得到了这个结果:
Avuncular(当天正确的单词)
定义:
[]
这是我的代码:
from lxml import html
import requests
page = requests.get('https://www.merriam-webster.com/word-of-the-day')
tree = html.fromstring(page.content)
word = tree.xpath('/html/body/div[1]/div/div[4]/main/article/div[1]/div[2]/div[1]/div/h1/text()')
WOTD = str(word)
WOTD = WOTD[2:]
WOTD = WOTD[:-2]
print(WOTD.capitalize())
print("Definition:")
wordDef = tree.xpath('/html/body/div[1]/div/div[4]/main/article/div[2]/div[1]/div/div[1]/p[1]/text()')
print(wordDef)
[] 应该是第一个定义,但由于某种原因不起作用。
任何帮助将不胜感激。
【问题讨论】:
标签: python html xpath web-scraping lxml