【发布时间】:2016-01-28 18:01:47
【问题描述】:
我有一个电影评级表,其中包含数百万行包含用户 ID、电影 ID 和评级的行。
| userId | movieId | rating |
------------------------------
| 1 | 213 | 5 |
| 1 | 245 | 4 |
| 2 | 213 | 4 |
| 2 | 245 | 4 |
| 3 | 657 | 5 |
| 3 | 245 | 5 |
我正在尝试找出一种将包含匹配的电影 ID 集的用户 ID 组合在一起的方法。理想情况下,我希望查询仅在它们至少有 5 个共同的电影 ID 并且评分高于 4 时才找到匹配项,但我已在此示例中对其进行了简化。
在上面的实例中,userId 1 和 2 将是唯一匹配的用户,因为它们都包含相同的 movieId。我需要一个基本上可以复制这一点的声明。提前感谢您的帮助。
【问题讨论】:
-
您能分享您尝试过的任何查询的结果吗?
-
简化很好,但我认为在这种情况下您可能过于简化了。