【发布时间】:2022-01-26 04:49:17
【问题描述】:
我必须从 API 中提取数据并返回包含所需信息的报告。 例如:
request_data = {'url1 : https://abcd.com','url2 : https://dfgh.com','url3 : https://hjkl.com',column : (name,Ecode,salary,status)}
x1 = '{ "name":"John", "age":30, "city":"New York"}'
x2 = '{ "name":"John", "age":30, "Ecode":"4567"}'
x3 = '{ "name":"John", "salary":30k, "Status":"Yes"}'
这里的 request_data 是我通过消息队列收到的 get 请求,x1,x2,x3 是我们在从 python 运行 get 请求后获得的值。获得数据后,我将其转换为 pandas 数据框并使用 pandas 数据框合并创建一个新的数据框。
但获取请求中的 url 数量不会是 3。应该是 2,5,1 等等。所以我们不能明确地将变量命名为 x1,x2,x3 作为存储数据的变量。
我想让代码更加动态,以便我们从消息队列中获得任意数量的 url 请求,我们需要从这些 url 中获取数据并创建一个包含所需列的新数据框。
有人可以在这里帮助我或指向一些参考链接。
【问题讨论】:
-
您可以创建一个包含多个数据框的数组。遍历所有响应,创建一个新的 df 并将其附加到主列表。