【问题标题】:Scraping a javascript / json object from a webpage using BeautifulSoup?使用 BeautifulSoup 从网页中抓取 javascript / json 对象?
【发布时间】:2015-08-21 01:32:29
【问题描述】:

我正在使用 BeautifulSoup 来获取网页的 HTML。到目前为止效果很好。但我真正想要的是 HTML 中这个 javascript 块的内容,它用<script type="text/javascript"> 封装,然后在那个标签内,最终有一个巨大的数组东西,里面有很多{} 括号,我相信这一点是 JSON 数组吗?

有没有办法可以尝试从 HTML 中提取整个数组?

【问题讨论】:

  • 除非它在一个字符串中并用 JSON.parse 解析它是一个 JavaScript 对象文字。 JSON 恰好与这种 JavaScript 语法密切相关(有限制和细微差别)。
  • 在 Javascript 中,{}(大括号)表示object[](方括号)表示array
  • import json 然后 foo = json.loads(objectText) : 18.2. json — JSON encoder and decoder

标签: javascript python html json beautifulsoup


【解决方案1】:

您正在寻找函数json.loads

>>> import json
>>> obj = json.loads('{"a": 12, "b": null}')
>>> obj
{'b': None, 'a': 12}

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-09-10
    • 2020-09-17
    • 1970-01-01
    • 2017-08-24
    • 2021-06-21
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多