【发布时间】:2018-09-20 15:55:00
【问题描述】:
目前我正在抓取文章新闻网站,在获取其主要内容的过程中,我遇到了很多在其中嵌入了这样的推文的问题:
我使用带有XPath helper(chrome addon) 的XPath 表达式来测试我是否可以获取内容,然后将此表达式添加到scrapy python,但是#shadow-root 中的元素似乎超出了范围对于 DOM,我正在寻找一种在这些类型的元素中获取内容的方法,最好是使用 XPath。
【问题讨论】:
标签: xpath web-scraping scrapy shadow-dom