Question

我有一个for循环，要遍历6907行大约需要20秒。该循环完成了在给定查询集中列出唯一区域名称的工作。我在代码的各个位置放置了时间戳，以记录时间。花费更多时间的“ for”循环在变量“ t3”和“ t4”之间。

时间戳

t = 12:27:22:169533
t2 = 12:27:22:173535
t3 = 12:27:22:793567
6907
t4 = 12:27:42:907362
t5 = 12:27:43:242596
t6 = 12:27:43:242596

6907是我的查询集sales_data的长度

views.py

class MSZoneProduct(generic.TemplateView):
    template_name = 'sales/MSZoneProduct.html'
    form_class = MSZoneProductForm

    def get(self, request, *args, **kwargs):
        if request.user.is_authenticated:
            form = self.form_class(request.GET)
            context = {'form': form}
            if form.is_valid():
                zone_code_ = form.cleaned_data['zone_name']
                product_code_ = form.cleaned_data['product_name']

                t = datetime.now().strftime('%H:%M:%S:%f')
                print("t = " + t)
                product = Product.objects.get(product_code=product_code_)
                t2 = datetime.now().strftime('%H:%M:%S:%f')
                print("t2 = " + t2)
                sales_data = Sales.objects.filter(zone_code=zone_code_, product_code=product).select_related()
                t3 = datetime.now().strftime('%H:%M:%S:%f')
                print("t3 = " + t3)
                print(len(sales_data))
                regions = []
                message = ""
                regions_dict = {}
                for x in sales_data:
                    if x.region_name not in regions:
                        regions.append(x.region_name)
                    else:
                        continue
                t4 = datetime.now().strftime('%H:%M:%S:%f')
                print("t4 = " + t4)
                for x in regions:
                    sum_ = 0
                    for y in sales_data:
                        if y.region_name == x:
                            sum_ = sum_ + y.quantity
                    regions_dict[x] = sum_
                t5 = datetime.now().strftime('%H:%M:%S:%f')
                print("t5 = " + t5)
                if len(regions) == 0:
                    message = "There is no data available for this product in this particular region."

                context = {'form': form, 'message': message, 'data': regions_dict}
                t6 = datetime.now().strftime('%H:%M:%S:%f')
                print("t6 = " + t6)
                return render(request, 'sales/MSZoneProduct.html', context)

            return render(request, 'sales/MSZoneProduct.html', context)
        else:
            return redirect('/sales/')

Answer 1

根据您的观点，您想对每个区域的数量进行汇总。我们可以将所有这些逻辑移到数据库查询中。这不仅使它更高效，而且更加优雅：

from django.db.models import Sum

sales_data = Sales.objects.filter(
    zone_code=zone_code_, product_code=product
).values('region_name').annotate(
    total_quantity=Sum('quantity')
).order_by('region_name')

这将导致QuerySet包含带有两个元素的字典：'region_name'映射到该区域的名称，而total_quantity对该区域的数量求和。< / p>

接下来，我们可以将其转换为字典regions_dict：

regions_dict = { r['region_name']: r['total_quantity'] for r in sales_data }

Answer 2

使用具有列表理解能力的集合吗？

regions = set(x.region_name for x in sales_data)

唯一的问题是是否需要按顺序订购物品。您可以根据实际情况对它们进行排序，您可以根据是否将它们成功添加到集合中将它们追加到列表中。

编辑：我同意在数据库中这样做是更好的方法（@Willem Van Onsem的答案），但是此答案与不使用Django的任何人有关。

Answer 3

使用dict理解和sales_data = ...，可以更有效地完成从t5 = ...到itertools.groupby的整个代码：

from itertools import groupby
from operator import itemgetter
regions_dict = {k: sum(map(itemgetter('quantity'), g)) for k, g in groupby(Sales.objects.filter(zone_code=zone_code_, product_code=product).order_by('region_name').values('region_name', 'quantity'), itemgetter('region_name'))}

Answer 4

改进针对 可以直接在字典的第一行中存储和，复杂度为O（N）

regions_dict_sums = {x.region_name:0 for x in sales_data}
for x in sales_data:
    regions_dict_sums[x.region_name]+=x.quantity

因此，销售额大于零的总区域将在字典中散列为键，并且它们的值是该区域的总销售额，可以在固定时间访问。

如何提高速度的“ for”循环性能？

4 个答案: