【发布时间】:2020-10-27 05:08:42
【问题描述】:
我可以用标准的 Scrapy 刮这个还是我需要使用 Selenium?
html 是:
<td class="example"><sprite-svg name="EXAMPLE2"><svg><use
xlink:href="/spritemap/1_0_30#sprite-EXAMPLE2"></use></svg></sprite-svg></td>
不知何故,我需要值“EXAMPLE2”。
在浏览器中工作的 xpath 是 //td[@class='example']//*[local-name() = 'svg']
当我将它放入 scrapy 时,我使用以下代码,但出现 XPATH 错误。
'example' : div.xpath(".//td[@class='example']//*[local-name() = 'svg']
()").extract()
任何想法如何刮掉它?
【问题讨论】:
-
xpath 开头有一个点。你也可以分享网站页面网址吗??
-
您在此处链接的页面,在控制台中 $x("//td[@class='example']") 返回空数组。您可以检查一下吗?
-
如何判断哪一只是灰狗?
标签: python svg web-scraping scrapy sprite