【发布时间】:2011-11-05 07:23:09
【问题描述】:
假设FirstName MiddleName(s) LastName的西方命名约定,
从全名中正确解析出姓氏的最佳方法是什么?
例如:
John Smith --> 'Smith'
John Maxwell Smith --> 'Smith'
John Smith Jr --> 'Smith Jr'
John van Damme --> 'van Damme'
John Smith, IV --> 'Smith, IV'
John Mark Del La Hoya --> 'Del La Hoya'
...以及由此而来的无数其他排列。
【问题讨论】:
-
找人来做。
-
这就是目前正在做的事情。
-
这看起来像是一个很好的机器学习问题——关键是你必须做好犯错的准备,但希望成功率提高。
-
你说的是“西方”,但你并不是这个意思。西班牙名字有父名,然后是母名等。You actually cannot do this.,即使是你所谓的西方名字。它只是行不通。
-
我不同意你不能这样做的说法。你可以,但它不会是完美的。唯一的问题是,根据您的领域,您将获得更高或更低的识别精度/召回率。在技术层面:有很多可能性。例如,您可以使用机器学习根据数据集中的示例来了解名称的外观。