【发布时间】:2014-05-07 05:32:02
【问题描述】:
是否可以对标记中的文本进行标记,以便将名字和姓氏组合在一个标记中? 例如,如果我的文字是:
text = "Barack Obama is the President"
然后:
text.split()
结果:
['Barack', 'Obama', 'is', 'the, 'President']
如何识别名字和姓氏?所以我只得到['Barack Obama', 'is', 'the', 'President'] 作为令牌。
有没有办法在 Python 中实现?
【问题讨论】:
-
希望这有帮助:nltk.org/book/ch07.html