【发布时间】:2019-02-10 11:52:49
【问题描述】:
我正在尝试根据模式序列从句子中提取一个块。
import re
import spacy
nlp = spacy.load('en')
s = "His name is Robinson."
doc = nlp(s)
pattern = re.compile(r'(<PRP$|POS>+<RB.?>)*(<JJ.?>)*(<NN.?|VBG|VBN>+<VB.?
|MD|RP>+)')
for chunk in doc:
if(re.search(pattern,chunk.tag_)):
print(chunk, chunk.tag_)
通过这个获取的chunk应该是“他的名字是”
我该如何实现?
【问题讨论】:
标签: python regex python-3.x nlp nltk