【问题标题】:How to extract text from POPUP window如何从弹出窗口中提取文本
【发布时间】:2020-12-29 16:56:48
【问题描述】:
我正在使用 Python Scrapy 解析tripadvisor 上的一些餐馆。单击“查看所有详细信息”按钮会激活一个弹出窗口,其中包含相关信息。流量分析表明点击时没有调用任何内容。但是,如果我在网页的窗口内搜索文本,我可以找到一个元素(请参见下面的屏幕截图),但我不知道如何处理它以及如何提取文本。
附:我已经设法用 selenium 获取窗口的内容,但我真的只想用 Scrapy 来做。
提前感谢您的帮助!
一个链接,例如Link
【问题讨论】:
标签:
python
web-scraping
scrapy
【解决方案1】:
从这个问题中得到了解决方案:Question link
这是一个将scrapy的响应转换为json的代码示例
# get html text
resp_text = response.text
# Html to json
data = re.search(r'window\.__WEB_CONTEXT__=(.*?});', resp_text).group(1)
data = data.replace('pageManifest', '"pageManifest"')
data = json.loads(data)