【发布时间】:2017-07-04 11:46:19
【问题描述】:
JSON RESPONSE FROM WEBSITE 我是 python scrapy 和 json 的新手。我正在尝试从 78751 抓取 json 响应。但它显示错误。我使用的代码是
import scrapy
import json
class BlackSpider(scrapy.Spider):
name = 'black'
start_urls = ['https://appworld.blackberry.com/cas/content/2360/reviews/2.17.2?page=1&pagesize=100&sortby=newest&callback=_content_2360_reviews_2_17_2&_=1499161778751']
def parse(self, response):
data = re.findall('(\{.+\})\);', response.body_as_unicode())
a=json.loads(data[0])
item = MyItem()
item["Reviews"] = a["reviews"][4]["review"]
return item
它显示的错误是 ValueError("无法解码任何 JSON 对象")ERROR
【问题讨论】:
-
看起来您的页面返回的是 HTML 内容而不是 JSON。通过 curl 检查它给我一个 html 文件,上面写着该站点正在维护中。
-
它在这里工作让我添加网站的屏幕截图
标签: python json web-scraping scrapy