【发布时间】:2020-02-14 03:15:56
【问题描述】:
我有一个实体提取任务,需要 wikidata、freebase、DBpedia 等 KB。鉴于它们的巨大尺寸,很难从中下载和提取实体。是否有一个 python 客户端可以通过 API 调用以非结构化文本作为输入来获取提取信息?
【问题讨论】:
标签: nlp dbpedia freebase wikidata named-entity-extraction
我有一个实体提取任务,需要 wikidata、freebase、DBpedia 等 KB。鉴于它们的巨大尺寸,很难从中下载和提取实体。是否有一个 python 客户端可以通过 API 调用以非结构化文本作为输入来获取提取信息?
【问题讨论】:
标签: nlp dbpedia freebase wikidata named-entity-extraction
至少对于 DBPedia,您可以使用 DBPedia Spotlight,类似这样:
spotlight_url = 'http://api.dbpedia-spotlight.org/en/annotate?'
params = dict(text="Barack Obama was a president", confidence='0.2', support='10')
headers = {'Accept':'application/json'}
resp = requests_retry_session().get(url=spotlight_url, params=params,headers=headers)
results = resp.json()
如果您要进行大量查询,您将在三元存储中本地安装知识库,并在本地安装 Spotlight。
【讨论】: