【发布时间】:2021-05-08 16:25:13
【问题描述】:
如何限制上传到 Elasticsearch 的数据数量?我的旧笔记本电脑无法像我正在使用的那样处理庞大的数据集。
我已使用以下代码“限制”要上传的数据
from elasticsearch import helpers, Elasticsearch
import csv
import itertools
with open('my_data.csv', encoding="utf8") as f:
reader = csv.DictReader(f)
for row in itertools.islice(reader, 1000): #limitation of data
helpers.bulk(es, reader, index='movie-plots', doc_type=None)
但这显然行不通;当我检查 'POST movie-plots/_count' 时,它会返回整个数据集的初始大小。
如果这是一个新手问题,我对 Elasticsearch 完全陌生,很抱歉。我正在使用 Python 客户端(在 Jupyter 笔记本中)以使用 Elasticsearch 和 Kibana。
【问题讨论】:
标签: python elasticsearch elasticsearch-py