【发布时间】:2018-02-28 22:20:27
【问题描述】:
我正在研究从医学文本中提取信息(对 NLP 来说非常新!)。目前,我有兴趣查找并提取预定义药物列表中提到的药物。例如,考虑以下文本:
“约翰因高温服用了阿司匹林”
因此,给定药物列表(Python 语言):
list_of_meds = ['aspirin', 'ibuprofen', 'paracetamol']
提取的药物是aspirin。没关系。
现在考虑另一种情况:
“给约翰开了布洛芬,因为他不能耐受扑热息痛”
现在,如果我使用列表(例如使用正则表达式)提取药物,那么提取的药物是ibuprofen 和paracetamol。
QUESTION如何区分实际处方药和不耐受药物?有没有办法标记处方(使用)和其他提到的药物?
【问题讨论】:
标签: python nlp regex-negation data-extraction