【发布时间】:2018-07-16 03:09:13
【问题描述】:
我有一个包含这种格式数据的文本文件。我要取医生的名字。我可以知道什么是正则表达式或任何其他可以处理这两种情况的方法
The patient is referred by Dr. Zach Foster.
The patient is referred by
Dr. Corey Piccirillo
Output:
Dr. Zach Foster
Dr. Corey Piccirillo
我在第一种情况下使用下面的正则表达式,然后使用 Spacy 来获取名称:
re(r'.*referred by.*',re.I)
对于第二种情况:
for line in file:
if "referred by" in line:
print(next(ifile, '').strip())
【问题讨论】:
标签: regex python-3.x data-extraction