【发布时间】:2019-05-21 15:27:29
【问题描述】:
我有一个用例,我需要在新闻标题中提取房地产名称、城市和州(如果有)并与数据库中可用的记录进行匹配。我能够使用 python 中的开源 NLP 统计模型从新闻标题中提取实体,但在将城市名称与数据库记录城市名称匹配时遇到问题。
例如,将从新闻标题中提取的城市名称“纽约”与城市名称“纽约”的数据库行进行匹配。
我尝试了多个 python 库,例如 Fuzzy Wuzzy、Levenshtein 距离、Spacy 相似度函数,但似乎不适合我的用例。
我需要一些关于如何实现城市名称匹配和生成相对匹配分数的指导。
【问题讨论】:
-
请说明您是如何尝试这些多个库的,以及为什么它们的结果不能让您满意 - 然后有人会想出要改进的地方。