https://github.com/explosion/spaCy/issues/1966

from spacy.gold import biluo_tags_from_offsets

doc = nlp(u'I like London.')
entities = [(7, 13, 'LOC')]
tags = biluo_tags_from_offsets(doc, entities)
assert tags == ['O', 'O', 'U-LOC', 'O']

 

比较简便的方法是根据这个函数来转换,但是不是转换为BIO,而是BILUO格式,如下:

NER:偏移json格式与Conll格式的转换

 

U表示单个实体,L表示长度>=2的实体的末尾。

如果想再转换为BIO,可以写一个脚本,应该还是比较简单的。 

2.conll转换为json

https://stackoverflow.com/questions/58299682/how-to-import-text-from-connl-format-with-named-entities-into-spacy-infer-entit

 

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-12-25
  • 2021-12-20
  • 2022-12-23
  • 2022-01-02
  • 2021-12-22
猜你喜欢
  • 2021-07-03
  • 2022-01-30
  • 2021-11-20
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案