【发布时间】:2009-10-04 12:16:49
【问题描述】:
假设我有这张桌子:
ID | description
-------------------
5 | The bird flew over the tree.
2 | The birds, flew over the tree
这两行具有“相似”的内容。我将如何删除#2?
- 我应该对“相似”文本使用什么算法?
- 我将如何使用 Python 做到这一点?
谢谢!
【问题讨论】:
-
Alex,需要对多少行进行重复数据删除?数百、数千、数百万等等...?
标签: python mysql algorithm string