【发布时间】:2017-06-23 10:45:45
【问题描述】:
我有一个对象或数据包含 id、姓名、城市、pin、电子邮件、电话详细信息。我收集了这样的大量数据。现在我想将一个新数据与现有的海量数据进行比较,最后需要看看数据匹配的最大值。
目前我正在多个线程中迭代现有数据以解决此问题,这需要大量时间。
*示例: 现有数据, id=1,name=A,city=B,pin=1,email=C,phone=1 id=2,name=D,city=F,pin=1,email=G,phone=1
新数据
id=1,name=A,city=B,pin=2,email=C,phone=2
结果; 最大匹配的相似数据是第一行 id,name,email 匹配*
是否有为此优化的企业解决方案?
【问题讨论】:
-
Graph 数据库有没有简单的方法来解决这个问题?如何获得近距离匹配?
标签: database search neo4j database-performance graph-databases