【发布时间】:2020-07-31 22:26:16
【问题描述】:
我正在尝试将包含多个工作表的多个 .xlsx 文件中的数据导入到弹性搜索中。我的流程是这样的:
- 我打开 xlsx 文件并创建所有工作表的列表
- 我为每个工作表创建了一个 pandas 数据框并将其转换为 json
- 我使用 helpers.bulk 方法将 json 导入弹性。 我的问题是,当我运行它时,我得到了错误:
RequestError: RequestError(400, 'action_request_validation_exception', 'Validation Failed: 1: index is missing;2: type is missing;
谁能指出一个循环遍历多个文件和多个工作表的示例?
【问题讨论】:
-
批量索引时必须指定类型
-
当我尝试使用帮助程序批量导入时,语法为
result = helpers.bulk(es, create_json(file,sheets,dfs), chunk_size=1000)。根据帮助文档,我没有可以定义索引名称或类型的地方