【发布时间】:2021-03-19 01:46:59
【问题描述】:
我必须在所有具有该术语的匹配文档中找到该术语的出现频率,例如:“天空”。例如:如果doc1有一个句子,
“天是蓝的。天是蓝的。”
而doc2有一句话,
“飞机在天上飞”。
那么术语“天空”的总频率应该是 3。我找到了这里提到的术语向量:https://www.elastic.co/guide/en/elasticsearch/reference/current/docs-termvectors.html 它是 Python API,http://elasticsearch-py.readthedocs.io/en/master/api.html?highlight=term%20vector#elasticsearch.Elasticsearch.termvectors
但是当我尝试实现它时:
es.search(index="abc", body={"from":0, "size":0,"term vectors":{"fields":["sky"],"field_statistics":"true"}})
我收到一个错误:
引发 HTTP_EXCEPTIONS.get(status_code, TransportError)(status_code, error_message, additional_info) elasticsearch.exceptions.RequestError: TransportError(400, u'parsing_exception', u'Unknown key for a START_OBJECT in [term vectors].')
【问题讨论】:
标签: python elasticsearch