【发布时间】:2016-02-22 20:47:25
【问题描述】:
我在对应的两列中有一行 10,000 个名称,每列 10,000 个。 A 列中的每个单元格对应于 B 列中的相邻单元格。我想做一个模糊匹配并获得所有这些单元格与相邻单元格的兼容性分数。我不希望它搜索整个列而不是整个列,只搜索相邻的单元格,我似乎无法使用 Fuzzy Match Excel 插件来完成,想法?
例子:
Column A: Column B: Value:
Apple Aplle 80%
Banana Banana 100%
Orange Ornge 85%
【问题讨论】:
-
您希望如何计算第三列中的值??
-
嗨,我只是想要一个关于名称相似程度的置信度分数?有些可能完全匹配,有些可能完全不同。完全像模糊匹配工具,但我不认为我可以将其设置为只执行相邻单元格,它只计算列与列。谢谢!
-
这将与公式相当复杂;非 vba 解决方案可能需要一些辅助列,这些辅助列的数量等于要比较的最大字母数。我怀疑这就是你要找的。问题是您希望 Apple 在将“p”更改为“l”时仅显示 1 个字母,但您希望 Orange 在缺少字母时仅显示 1 个字母 [我相信这些只是 Levenshtein 距离]。如果只是逐个字母比较的话,使用 Excel 公式很难证明 Orange 不是 4 个字母不同。
标签: excel excel-formula fuzzy-search fuzzy-comparison