【发布时间】:2022-01-14 20:23:27
【问题描述】:
有一个网站,我需要从在线游戏项目和研究中获取该项目的所有者,我需要进行一些“网络抓取”来获取这些数据。但是,信息在 Javascript 文档/代码中,不是一个易于解析的 HTML 文档,如 bs4 表明我可以轻松地从中提取信息。所以,我需要在这个 javascript 文档中获取一个变量(包含我正在查看的项目的所有者列表)并 将它变成一个可用的列表/json/字符串,我可以在我的程序中实现。有没有办法我可以做到这一点?如果可以,我该怎么做?
我附上了一张我在查看我所在网站的页面源代码时需要的变量的图片。
我当前的代码:
from bs4 import BeautifulSoup
html = requests.get('https://www.rolimons.com/item/1029025').content #the item webpage
soup = BeautifulSoup(html, "lxml")
datas = soup.find_all("script")
print(data) #prints the sections of the website content that have ja
【问题讨论】:
-
你的附件图片在哪里?
-
已修复,抱歉,我是 stackoverflow 的新手
标签: python parsing beautifulsoup html-parsing