Django：通过删除 340 个重复查询进行高效查询答案

【问题标题】：Django: Making an efficient query by removing 340 duplicate queriesDjango：通过删除 340 个重复查询进行高效查询
【发布时间】：2017-06-13 09:53:24
【问题描述】：

我正在按天绘制一堆价格数据。想想每天的股票交易。

我想做的事：

按天显示交易
显示价格的平均线以显示总体趋势

问题：

当我在 Django 调试工具栏中查看查询时，我看到：

346 个查询
1498.11ms
查看实际查询，我看到 get_queryset() 每天查询时出现“重复 340 次”。
如何提高效率，避免重复？任何有关如何使其尽可能高效的提示/技巧将不胜感激。

如何：

我有一个继承自 GraphView 的视图，该视图用于返回绘制返回对象价格所需的数据。由于此请求可能返回数千个结果，因此使此查询尽可能高效对于加载时间很重要。

使用的工具：

Django 1.10.1
Postgres
在模板中绘制结果图表
Django 调试工具栏

查看和查询：

class GraphView(TemplateView):

    def get_dates(self):
        dates = []
        if self.get_queryset():
            start = self.get_queryset()[0][2].date()
            end = datetime.today().date()
            delta = end - start
            for i in range(delta.days + 1):
                dates.append(start + timedelta(days=i))
        return dates

    def trend_line(self):
        trades = self.get_queryset()
        dates = self.get_dates()
        data_x = []
        data_y = []

        for date in dates:
            subset = trades.filter(date_of_price__date=date)
            prices_for_day = subset.aggregate(Avg('price'))
            if prices_for_day['price__avg'] > 0:
                data_x.append(date.strftime('%Y-%m-%d'))
                data_y.append(prices_for_day['price__avg'])
        return data_x, data_y

    def get_context_data(self, **kwargs):
        context = super(GraphView, self).get_context_data(**kwargs)
        x_axis_date = []
        y_axis_price = []
        bubble_text = []
        for trade in self.get_queryset():
            x_axis_date.append(trade[2].date().strftime('%Y-%m-%d'))
            y_axis_price.append(int(trade[1]))
            desc = "#%s" % (trade[0])
            bubble_text.append(str(desc.encode('ascii', 'ignore')))

        trend_data_x, trend_data_y = self.trend_line()

        try:
            x_axis_date_start = x_axis_date[0]
        except IndexError:
            x_axis_date_start = None

        try:
            x_axis_date_end = x_axis_date[-1]
        except IndexError:
            x_axis_date_end = None

        context.update({
            "x_axis_date": x_axis_date,
            "x_axis_date_start": x_axis_date_start,
            "x_axis_date_end": x_axis_date_end,
            "y_axis_price": y_axis_price,
            "bubble_text": bubble_text,
            "trend_data_x": trend_data_x,
            "trend_data_y": trend_data_y,
        })
        return context


 class ReferenceDetailView(StaffuserRequiredMixin, SetHeadlineMixin, GraphView):
        headline = "Variation Detail"
        template_name = "ref_trades/reference_detail.html"

        def get_reference_model(self):
            return get_object_or_404(ReferenceModel, pk=self.kwargs["pk"])

        def get_headline(self):
            return "%s" % self.get_reference_model()

        def get_queryset(self):
            return TradeModel.objects.filter(
                date_of_price__gte=datetime.now() - timedelta(days=365),
                reference_model__id=self.kwargs["pk"]
            ).exclude(price=0).values_list('id', 'price' , 'date_of_price', 'title')

谢谢

感谢您的帮助！

【问题讨论】：

你使用缓存吗？
不是本地的开发人员
那么这很可能是 DDT 正在处理的问题，您可能希望至少为开发人员打开 LocMemCache。唯一的另一个不确定点是data_points 中的 for 循环中的查询

标签： django django-views django-queryset

【解决方案1】：

您可以检索按日期排序的所有对象，然后使用itertools.groupby() 将它们拆分为日期，而不是每天执行一次查询。

def data_points(self):
    trades = self.get_queryset()
    data_x = []
    data_y = []

    for date, subset in itertools.groupby(trades, lambda t: t.date):
        average_price = average(subset) # average() needs to be implemented
        if average_price > 0:
            data_x.append(date.strftime('%Y-%m-%d'))
            data_y.append(average_price)
    return data_x, data_y

这种方法将 Web 服务器 CPU 换成 DB CPU/IO，这可能是也可能不是最好的方法，具体取决于您的基础架构

【讨论】：

感谢 Iain，groupby 帮了大忙。结果：22 毫秒内 5 次查询！再次感谢，不胜感激！