【发布时间】:2015-08-21 01:32:29
【问题描述】:
我正在使用 BeautifulSoup 来获取网页的 HTML。到目前为止效果很好。但我真正想要的是 HTML 中这个 javascript 块的内容,它用<script type="text/javascript"> 封装,然后在那个标签内,最终有一个巨大的数组东西,里面有很多{} 括号,我相信这一点是 JSON 数组吗?
有没有办法可以尝试从 HTML 中提取整个数组?
【问题讨论】:
-
除非它在一个字符串中并用 JSON.parse 解析它是一个 JavaScript 对象文字。 JSON 恰好与这种 JavaScript 语法密切相关(有限制和细微差别)。
-
import json然后foo = json.loads(objectText): 18.2. json — JSON encoder and decoder
标签: javascript python html json beautifulsoup