【发布时间】:2019-08-13 14:26:23
【问题描述】:
我正在尝试使用 Python 3 中的 Selenium 从下面的网页中抓取数据:
如果此 URL 被视为页面源(对于 Chrome 用户:查看源:https://www.whoscored.com/Matches/1285051/Live/England-Premier-League-2018-2019-West-Ham-Huddersfield),则文本中有一些 JSON。我的目标是抓取第一个非常重要的 JSON,它位于“var matchCentreData”位中。下面是一个 sn-p:
<script type="text/javascript">
var matchCentreData = {"playerIdNameDictionary":{"14244":"Pablo Zabaleta",
"89998":"Manuel Lanzini","34693":"Marko Arnautovic","93026":"Felipe Anderson",
"300359":"Issa Diop","122980"
我能够抓取整个页面源,但是,我正在努力仅提取上面的 JSON。任何帮助将不胜感激!
【问题讨论】:
标签: python selenium web-scraping