【发布时间】:2018-03-06 08:50:10
【问题描述】:
想法。 我想构建一个类似的函数:
location_affinity(user_a, user_b)
在两个用户之间建立位置关联。特别是,此函数将返回一个介于 0(无亲和力)和 1(最大亲和力)之间的浮点数,指示 user_a 去过多少地方与 user_b 去过多少地方。例如:如果 user_a 总是和 user_b 呆在一起并跟着他到他去的每个地方,我期待结果是“1”。如果 user_a 离 user_b 很远,而且他们从来没有靠近过,我预计结果是“0”。
数据。 每个用户都有一个他去过的点(纬度,经度)的列表,这些点已经从用户的 Facebook 地理标签中提取出来。 将其可视化:IMAGE
- 红色“X”是点(lat,lng)user_a 已经过。
- 绿色的“X”是点(lat, lng)user_b 已经过。
- 蓝色区域代表重叠。
问题。 是否有任何已知的算法可以根据两个用户的地图点列表建立亲和力(我认为这取决于重叠区域)? 如果没有,我应该搜索哪些关键字?
附加。 我正在尝试使用 Spark 构建 Python 函数。有没有集成?
谢谢。
【问题讨论】:
-
每个用户积分列表中有多少积分?
标签: python dictionary apache-spark tags geotagging