【发布时间】:2015-05-21 21:47:12
【问题描述】:
这个问题是基于我问的SQL: Find longest common string between rows,但我没有解释清楚,所以我会再试一次。 我有桌子 t1:
Col1 | Col2
-------|----------------
1 | THE APPLE 123
1 | BEST THE APPLE
1 | THE APPLE 5/89
2 | BEST TASTY BANANAS
2 | BEST TASTY BANANAS 42/7
2 | THE BEST TASTY BANANAS
我想要t2:
Col1 | Col2
-----------------------------
1 | THE APPLE
2 | BEST TASTY BANANAS
我的整个表有 30,000 条记录。在任何时候我都不必比较超过 21 条记录。 Col2 是 varchar(100)。我正在使用红移。我意识到这是一个难题,有什么方法可以将数据从红移中取出并在 Python 之类的东西中使用某种模糊字符串匹配?谢谢。
【问题讨论】:
-
你尝试了什么,你的尝试是如何失败的?
-
你承诺解释清楚,但你什么也没解释。
标签: python sql string amazon-redshift