【发布时间】:2018-08-12 04:20:51
【问题描述】:
我正在尝试从该页面中获取目录 ID 号:
from scrapy.selector import Selector
from scrapy.http import HtmlResponse
url = 'http://www.enciclovida.mx/busquedas/resultados?utf8=%E2%9C%93&busqueda=basica&id=&nombre=astomiopsis+exserta&button='
response = HtmlResponse(url=url)
使用 css 选择器(在 R 中与 rvest::html_nodes 一起使用)
".result-nombre-container > h5:nth-child(2) > a:nth-child(1)"
我想检索目录 ID,在这种情况下应该是:
6011038
如果使用 xpath 更容易完成,我没问题
【问题讨论】:
-
您能否发布您正在使用的完整代码。也许我可以帮忙。