【问题标题】:How do I sort Django models by sum of calculated property?如何按计算属性的总和对 Django 模型进行排序?
【发布时间】:2018-10-15 20:09:18
【问题描述】:

我有两个模型,Project 和 Session。一个项目有很多会话,一个用户有很多项目:

class Project(models.Model):
    class Meta:
        ordering = [models.functions.Lower("name")]

    name = models.CharField(max_length=255)
    user = models.ForeignKey(User, on_delete=models.CASCADE)

class Session(models.Model):
    start = models.DateTimeField()
    end = models.DateTimeField()
    timezone = TimeZoneField()
    breaks = models.IntegerField(default=0, validators=[MinValueValidator(0)])
    project = models.ForeignKey(Project, on_delete=models.CASCADE)

    def duration(self):
        # returns minutes in (end - start)

我想要一种方法来获取给定用户的所有项目,按其所有会话的持续时间总和排序。由于session.duration() 不是数据库字段,而是根据数据库字段计算得出,因此我无法在单个数据库查询中获取此信息。

我目前的解决方案是:

sessions = Session.objects.filter(project__user=self)
groups = [[a, sum([s.duration() for s in b])] for a, b in groupby(
 sessions, key=lambda s: s.project
)]
groups = sorted(groups, key=lambda g: g[1], reverse=True)
return [g[0] for g in groups]

这会在一个查询中获取所有相关会话,但随后我按项目对它们进行分组,这需要很长时间 - 当有大约 100 个项目时大约需要一秒钟。有没有一种方法可以减少时间?理想情况下,不需要为每个项目调用数据库?

我正在使用 Django 2.0。

【问题讨论】:

    标签: django database django-orm


    【解决方案1】:

    您可以使用注释和聚合来实现这一点。首先,通过更改这一行来稍微修改 Session 模型:

    project = models.ForeignKey(Project, on_delete=models.CASCADE)
    

    到这里:

    project = models.ForeignKey(Project, related_name='sessions', on_delete=models.CASCADE)
    

    -现在每个Project 实例都会有一个sessions 字段,其中将包含与Project 相关的所有Sessions 的查询集。

    您可以获取所有用户的项目并循环遍历每个项目的会话,而不是像现在这样获取所有用户会话:

    projects = Project.objects.filter(user=self)
    for p in projects:
        sessions = p.sessions.all()
    

    然后您可以操作sessions 查询集,用如下表达式字段注释它们:

    from django.db.models import ExpressionWrapper, F, fields
    
    duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
    sessions = p.sessions.annotate(d=duration_)
    

    此时sessions 查询集的每个成员都将有一个名为d 的字段,用于保存响应Session 的持续时间。 总结持续时间,我们可以使用 Django 查询集的 aggregation 功能,如下所示:

    from django.db.models import Sum
    total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
    

    我们在第 2 行所做的是通过添加 d 字段中的所有值并分配结果来从查询集(“聚合”它)创建单个元素到名为total_duration 的字段。这个表达式的结果:

    sessions.aggregate(total_duration=Sum('d'))
    

    是一个dict,只有一个键 (total_duration),我们从中获取值。

    接下来,您可以建立一个项目和持续时间列表,然后按持续时间对其进行排序,例如像这样:

    import operator
    plist = []
    for p in projects:
        sessions = p.sessions.annotate(d=duration_)
        total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
        # total holds the sum of this project's sessions
        plist.append({'p':p,'total':total})
    plist.sort(key=operator.itemgetter('total'))
    
    projects = [item['p'] for item in plist]
    

    总结一下:

    import operator
    from django.db.models import F, Sum, ExpressionWrapper, fields
    
    duration_ = ExpressionWrapper(F('end') - F('start'), output_field=fields.DurationField())
    projects = Project.objects.filter(user=self)
    plist = []
    
    for p in projects:
        sessions = p.sessions.annotate(d=duration_)
        total = sessions.aggregate(total_duration=Sum('d'))["total_duration"]
        # total holds the sum of this project's sessions
        plist.append({'p':p,'total':total})
    
    plist.sort(key=operator.itemgetter('total'))
    
    projects = [item['p'] for item in plist]
    

    参考:this answerDjango Query ExpressionsDjango Aggregation

    【讨论】:

    • 谢谢你 - 我还是有点不清楚。这里total 是每个会话持续时间的总和。我需要的输出是按项目会话的总持续时间排序的项目列表。我觉得你已经完成了 90% 的工作,我只是不知道如何使用上面的 duration_ 字段来实现这一目标。
    • @SamIreland 我已经更新了我的答案。现在应该完成了。
    猜你喜欢
    • 1970-01-01
    • 2017-06-24
    • 1970-01-01
    • 2011-05-09
    • 1970-01-01
    • 2012-05-16
    • 2019-10-02
    • 2020-03-02
    相关资源
    最近更新 更多