【问题标题】:Django: Making an efficient query by removing 340 duplicate queriesDjango:通过删除 340 个重复查询进行高效查询
【发布时间】:2017-06-13 09:53:24
【问题描述】:

我正在按天绘制一堆价格数据。想想每天的股票交易。

我想做的事:

  • 按天显示交易
  • 显示价格的平均线以显示总体趋势

问题:

当我在 Django 调试工具栏中查看查询时,我看到:

  • 346 个查询
  • 1498.11ms
  • 查看实际查询,我看到 get_queryset() 每天查询时出现“重复 340 次”。
  • 如何提高效率,避免重复?任何有关如何使其尽可能高效的提示/技巧将不胜感激。

如何:

我有一个继承自 GraphView 的视图,该视图用于返回绘制返回对象价格所需的数据。由于此请求可能返回数千个结果,因此使此查询尽可能高效对于加载时间很重要。

使用的工具:

  • Django 1.10.1
  • Postgres
  • 在模板中绘制结果图表
  • Django 调试工具栏

查看和查询:

class GraphView(TemplateView):

    def get_dates(self):
        dates = []
        if self.get_queryset():
            start = self.get_queryset()[0][2].date()
            end = datetime.today().date()
            delta = end - start
            for i in range(delta.days + 1):
                dates.append(start + timedelta(days=i))
        return dates

    def trend_line(self):
        trades = self.get_queryset()
        dates = self.get_dates()
        data_x = []
        data_y = []

        for date in dates:
            subset = trades.filter(date_of_price__date=date)
            prices_for_day = subset.aggregate(Avg('price'))
            if prices_for_day['price__avg'] > 0:
                data_x.append(date.strftime('%Y-%m-%d'))
                data_y.append(prices_for_day['price__avg'])
        return data_x, data_y

    def get_context_data(self, **kwargs):
        context = super(GraphView, self).get_context_data(**kwargs)
        x_axis_date = []
        y_axis_price = []
        bubble_text = []
        for trade in self.get_queryset():
            x_axis_date.append(trade[2].date().strftime('%Y-%m-%d'))
            y_axis_price.append(int(trade[1]))
            desc = "#%s" % (trade[0])
            bubble_text.append(str(desc.encode('ascii', 'ignore')))

        trend_data_x, trend_data_y = self.trend_line()

        try:
            x_axis_date_start = x_axis_date[0]
        except IndexError:
            x_axis_date_start = None

        try:
            x_axis_date_end = x_axis_date[-1]
        except IndexError:
            x_axis_date_end = None

        context.update({
            "x_axis_date": x_axis_date,
            "x_axis_date_start": x_axis_date_start,
            "x_axis_date_end": x_axis_date_end,
            "y_axis_price": y_axis_price,
            "bubble_text": bubble_text,
            "trend_data_x": trend_data_x,
            "trend_data_y": trend_data_y,
        })
        return context


 class ReferenceDetailView(StaffuserRequiredMixin, SetHeadlineMixin, GraphView):
        headline = "Variation Detail"
        template_name = "ref_trades/reference_detail.html"

        def get_reference_model(self):
            return get_object_or_404(ReferenceModel, pk=self.kwargs["pk"])

        def get_headline(self):
            return "%s" % self.get_reference_model()

        def get_queryset(self):
            return TradeModel.objects.filter(
                date_of_price__gte=datetime.now() - timedelta(days=365),
                reference_model__id=self.kwargs["pk"]
            ).exclude(price=0).values_list('id', 'price' , 'date_of_price', 'title')

谢谢

感谢您的帮助!

【问题讨论】:

  • 你使用缓存吗?
  • 不是本地的开发人员
  • 那么这很可能是 DDT 正在处理的问题,您可能希望至少为开发人员打开 LocMemCache。唯一的另一个不确定点是data_points 中的 for 循环中的查询

标签: django django-views django-queryset


【解决方案1】:

您可以检索按日期排序的所有对象,然后使用itertools.groupby() 将它们拆分为日期,而不是每天执行一次查询。

def data_points(self):
    trades = self.get_queryset()
    data_x = []
    data_y = []

    for date, subset in itertools.groupby(trades, lambda t: t.date):
        average_price = average(subset) # average() needs to be implemented
        if average_price > 0:
            data_x.append(date.strftime('%Y-%m-%d'))
            data_y.append(average_price)
    return data_x, data_y 

这种方法将 Web 服务器 CPU 换成 DB CPU/IO,这可能是也可能不是最好的方法,具体取决于您的基础架构

【讨论】:

  • 感谢 Iain,groupby 帮了大忙。结果:22 毫秒内 5 次查询!再次感谢,不胜感激!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2015-07-20
  • 2023-03-13
  • 2011-03-11
  • 1970-01-01
  • 2020-02-17
  • 2011-12-21
  • 2011-08-18
相关资源
最近更新 更多