【发布时间】:2018-10-01 21:04:18
【问题描述】:
我最近开始使用 dask。我想使用 http 请求将数据发送到 REST API,API 返回一个 json 文件以验证数据上传是否成功。这是我的 API 调用函数:
def requestToAPI():
headers={'Content-Type': 'application/json'}
data = {
"api_key" : "xxxxxxxxxxxxx",
"attributes" : [
{
"external_id" : "user1",
"app_id" : "xxxx-xxx-xxxxx-xxxx",
"firs_name" : "user_firstname",
"last_name" : "user_lastname_test"
}
]
}
r = requests.post('https://abcdf.com/users/abdcgdu', headers=headers, data=json.dumps(data))
return r.json()
我有一些从以下代码中获得的 dask 数据帧块:
rChunk=dd.from_pandas(pandaDataFrame, chunksize=1000)
如何使用 dask 并使用上述块(假设每个块将更改为正确的 json 文件)向 API 发送并行请求并在其中一个请求失败/返回错误时进行正确的错误处理?
我尝试使用 dask.delayed:
[延迟(requestToAPI)(chunk) 用于 rChunk 中的块]
但不确定如何进行正确的错误处理??
【问题讨论】:
-
出现错误时您希望做什么?
-
@mdurant 只是打印出错误
标签: python api parallel-processing dask