【发布时间】:2018-10-25 16:50:01
【问题描述】:
我正在尝试获取在检查特定 URL 的页面源时看到的 JSON 数据。此 URL 有多个标签,但是这些标签中只有一个具有 JSON 格式的数据。
这是我目前的实现:
import urllib2
from bs4 import BeautifulSoup
import re
import json
url = "https://www.exampleURL.com"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page, 'html.parser')
scripts = soup.find_all('script')
for script in scripts:
try:
data = json.loads(script)
print("Success")
except Exception:
print("Not Successful")
此实现无法打印 Success。我想要的 JSON 数据格式如下,但是只有一个脚本标签有 JSON 数据,其他的都与我无关。
<script>
__DATA__ = {........};
</script>
【问题讨论】:
标签: python json beautifulsoup