【发布时间】:2016-05-03 23:12:43
【问题描述】:
我正计划对我的数据进行一些数据调整。
情况-我有一个包含country 字段的数据。它包含用户输入的国家/地区名称(它可能包含拼写错误或同一国家/地区的不同国家/地区名称,例如美国/美国/美国代表美国)。我有一个正确的国家名称列表。
我想要什么- 预测它指的是哪个最近的国家。例如-如果给出U.S.,那么它将更改为USA(我们列表中的正确国家名称)。
有什么方法可以使用 Java 或 opennlp 或任何其他方法吗?
【问题讨论】:
标签: java nlp string-matching text-mining opennlp