【发布时间】:2018-05-21 11:07:49
【问题描述】:
我已将旧 RDBMS 数据库中的一堆数据(500 000 条记录)导出为 json 格式的平面文件,例如:
{"index", {"_id": 1}}
{"Name": "Jack"}
...
{"index", {"_id": 500000}}
{"Name": "Joe"}
我正在尝试使用 CURL 命令将此文件索引到 Elasticsearch 中,但 CURL 命令只是退出而不索引任何数据且没有任何消息。
这是 CURL 命令:
curl -XPUT "localhost:9200/person/_doc/_bulk" -H "Content-Type: application/json" --data-binary "@person_data.json"
谁能建议我做错了什么?还是 CURL 命令无法发送大数据(尽管大约 175MB)?
我正在运行一个大型连接查询,这需要花费大量时间从 RDBMS 获取所有 500k 行。然后我将这些记录导出为 json 格式的文件,以便弹性搜索批量 API 可以使用它。但是,正如我所见,CURL 命令根本无法索引如此庞大的数据而没有任何错误消息。
在这种情况下,是否有任何 GUI/控制台工具可以批量索引数据?
【问题讨论】:
-
尝试用小数据集索引怎么样?结果会一样吗?
标签: elasticsearch