【发布时间】:2018-07-19 13:27:01
【问题描述】:
我正在从 API ('http://api.eia.gov/') 导入 JSON 文件。以下三行非常适合将时间序列数据放入数据框中:
d = json.loads(requests.get(page).text)
df = pd.DataFrame(d['series'][0]['data'])
df = df.set_index(df[0])
我的问题是提取与出现在字典末尾的数据无关的其他值/元素。这是我在终端中输入 d 时的一些输出。
In [72]: d
Out[72]:
{'request': {'command': 'series', 'series_id': 'STEO.COPR_AG.M'},
'series': [{'series_id': 'STEO.COPR_AG.M',
'name': 'Crude Oil Production, Algeria, Monthly',
'units': 'million barrels per day',
'f': 'M',
'copyright': 'None',
'source': 'U.S. Energy Information Administration (EIA) - Short Term Energy
Outlook',
'geography': 'DZA',
'start': '199401',
'end': '201806',
'lastHistoricalPeriod': '201803',
'updated': '2018-07-10T12:02:18-0400',
'data': [['201806', 1.04],
['201805', 1.02],
['201804', 0.99],
['201803', 0.99],
因此,使用上面的 df 可以为我提供时间序列的数据帧数据。但我不知道如何获取其他一些变量——比如“名称”或“lastHistoricalPeriod”
提前致谢。
【问题讨论】:
标签: json python-3.x dataframe