【发布时间】:2020-05-29 15:53:55
【问题描述】:
我无法弄清楚如何实现以下目标。我已经走到这一步了:
//*[@id="main"]/div[2]/section/div[2]/h1/span[1][starts-with(.,"IDENTIFIER")]/following::span[1]/text()
这将返回如下响应:
Foo1 Foo2 Foo3 Foo4
我试图只返回 Foo1 和 Foo2,其中 Foo1 和 Foo2 可以是任意长度的字符,并且后面可能有任意数量的额外 Foo。
我试过看
substring-before(//*[@id="main"]/div[2]/section/div[2]/h1/span[1][starts-with(.,"IDENTIFIER")]/following::span[1]/text(), ' ')
要提取到第一个空间,但是我做错了却碰壁了。
我在 Scrapy 蜘蛛中使用 xpath。任何帮助表示赞赏
【问题讨论】:
标签: xpath web-scraping scrapy