【发布时间】:2018-04-14 08:37:57
【问题描述】:
问题是我有一个包含超过 80k 图像的文件夹,其中大约 40% 是重复的。 (有些图片是旋转的,有些大小不同,但还是同一张图片)。
起初我使用散列算法(使用 c++/java)来删除所有重复的图像(具有相同的大小和其他属性)。 但它似乎并没有删除所有这些,因为有些图片有不同的大小(但在视觉上是相同的)
我在网上搜索了很多以找到任何有效的算法来解决这个问题
我为我的问题找到的最佳代码是 pHash,但它已经过时并且不再适用于 VS。
如果有人对我有想法,那就太棒了。
谢谢
【问题讨论】:
标签: c++ image duplicates