【发布时间】:2017-10-05 11:36:40
【问题描述】:
我的数据是这样组织的:
有 1k 名教师,10k 名学生,每个学生都有约 100 份作业。
我需要获取学生的所有作业,通过课程或通过他们之间的直接链接与老师相关。所有的顶点和边都有一些属性,假设所有需要的索引都已经建立,或者我们可以稍后讨论它们。
我可以通过足够快的查询获得所有需要的学生ID:
$query1 = "FOR v1 IN 1..1 INBOUND @teacherId teacher_pupil FILTER v1.deleted == false RETURN DISTINCT v1._id";
$query2 = "FOR v2 IN 2..2 INBOUND @teacherId OUTBOUND teacher_class, INBOUND pupil_class FILTER v2.deleted == false RETURN DISTINCT v2._id";
$queryUnion = "FOR x IN UNION_DISTINCT (($query1), ($query2)) RETURN x";
然后我写了以下内容:
$query = "
LET pupilIds = ($queryUnion)
FOR pupilId IN pupilIds
LET homeworks = (
FOR homework IN 1..1 ANY pupilId pupil_homework
return [homework._id, pupilId]
)
RETURN homeworks";
我得到了我的作业,我什至可以尝试过滤它们,但是查询太慢了——我相信这是一种不正确的方式。
问题 1 如何在不一次将所有 Homeworks 大量内存(LIMIT 或其他)、按顶点属性快速高效地排序和过滤 Homeworks 的情况下做到这一点?我确信在查询/子查询的 FOR 中限制学生或与学生相关的作业会导致不正确的排序/分页。
我又尝试了纯图形 AQL 查询:
$query1 = "FOR v1 IN 2..2 INBOUND @teacherId pupil_teacher, OUTBOUND pupil_homework RETURN v1._id";
$query2 = "FOR v2 IN 3..3 INBOUND @teacherId teacher_class, pupil_class, OUTBOUND pupil_homework RETURN v2._id";
$query = "FOR x IN UNION_DISTINCT (($query1), ($query2)) LIMIT 500, 500 RETURN x";
速度也快不了多少,不知道怎么按属性过滤Teacher顶点。
问题 2 构建此类 AQL 查询的最佳方法是什么,如何访问按属性过滤所有路径部分的图的顶点?我可以对结果进行分页以节省内存并加快查询速度吗?我怎样才能加快速度?
谢谢!
【问题讨论】:
标签: optimization graph query-optimization arangodb aql