使用 Python 中的知识库从文本中提取实体

【问题标题】：Extract entities from text using Knowledge Bases in Python使用 Python 中的知识库从文本中提取实体
【发布时间】：2020-02-14 03:15:56
【问题描述】：

我有一个实体提取任务，需要 wikidata、freebase、DBpedia 等 KB。鉴于它们的巨大尺寸，很难从中下载和提取实体。是否有一个 python 客户端可以通过 API 调用以非结构化文本作为输入来获取提取信息？

【问题讨论】：

标签： nlp dbpedia freebase wikidata named-entity-extraction

【解决方案1】：

至少对于 DBPedia，您可以使用 DBPedia Spotlight，类似这样：

spotlight_url = 'http://api.dbpedia-spotlight.org/en/annotate?'
params = dict(text="Barack Obama was a president", confidence='0.2', support='10')
headers = {'Accept':'application/json'}
resp = requests_retry_session().get(url=spotlight_url, params=params,headers=headers)
results = resp.json()

如果您要进行大量查询，您将在三元存储中本地安装知识库，并在本地安装 Spotlight。

【讨论】：