【发布时间】:2013-09-20 10:36:01
【问题描述】:
我们有一个包含公司名称和数字主键标识的表。我们正在清理数据,我们发现名称列中充满了代表同一家公司的相似名称。
例如BA 和 Ba 或 GTC Ltd 和 GTC Limited。
无论如何,我们是否可以使用 SQL Server 获得具有相似名称和 ID 列表的所有项目的计数和摘要。我想知道是否有某种相似性比较,我们可以为 etc 设置阈值
我们需要向客户提供一个看起来需要合并的名称列表。
【问题讨论】:
标签: sql sql-server data-analysis data-cleaning