加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 编程开发 > Python > 正文

python – 从一个庞大且不断增长的数据集中优化慢速django查询集

发布时间:2020-12-20 12:09:07 所属栏目:Python 来源:网络整理
导读:我的页面加载速度太慢.不知何故,我需要改进查询数据的方式(缓存?部分加载/页面等等) 注意我是一个django noob并且还没有完全包围我的模型.Manager和model.query.QuerySet所以如果这个设置看起来很尴尬…. 目前,页面加载查询集大约需要18秒,目前只有大约500
我的页面加载速度太慢.不知何故,我需要改进查询数据的方式(缓存?部分加载/页面等等)

注意我是一个django noob并且还没有完全包围我的模型.Manager和model.query.QuerySet所以如果这个设置看起来很尴尬….

目前,页面加载查询集大约需要18秒,目前只有大约500条记录.每天平均会有大约100条新记录.

Network stats

该数据库是Postgresql

慢视图:

def approvals(request):
    ...
    approved_submissions = QuestSubmission.objects.all_approved()
    ...

慢查询集:

class QuestSubmissionQuerySet(models.query.QuerySet):
    ...

    def approved(self):
        return self.filter(is_approved=True)

    def completed(self):
         return self.filter(is_completed=True).order_by('-time_completed')

    ...

class QuestSubmissionManager(models.Manager):
    def get_queryset(self):
        return QuestSubmissionQuerySet(self.model,using=self._db)

    def all_approved(self,user=None):
        return self.get_queryset().approved().completed()

    ...

从QuestSubmission.objects.all_approved()得到的SQL:

'SELECT "quest_manager_questsubmission"."id","quest_manager_questsubmission"."quest_id","quest_manager_questsubmission"."user_id","quest_manager_questsubmission"."ordinal","quest_manager_questsubmission"."is_completed","quest_manager_questsubmission"."time_completed","quest_manager_questsubmission"."is_approved","quest_manager_questsubmission"."time_approved","quest_manager_questsubmission"."timestamp","quest_manager_questsubmission"."updated","quest_manager_questsubmission"."game_lab_transfer" FROM "quest_manager_questsubmission" WHERE ("quest_manager_questsubmission"."is_approved" = True AND "quest_manager_questsubmission"."is_completed" = True) ORDER BY "quest_manager_questsubmission"."time_completed" DESC'

缓慢的模型:

class QuestSubmission(models.Model):
    quest = models.ForeignKey(Quest)
    user = models.ForeignKey(settings.AUTH_USER_MODEL,related_name="quest_submission_user")
    ordinal = models.PositiveIntegerField(default = 1,help_text = 'indicating submissions beyond the first for repeatable quests')
    is_completed = models.BooleanField(default=False)
    time_completed = models.DateTimeField(null=True,blank=True)
    is_approved = models.BooleanField(default=False)
    time_approved = models.DateTimeField(null=True,blank=True)
    timestamp = models.DateTimeField(auto_now=True,auto_now_add=False)
    updated = models.DateTimeField(auto_now=False,auto_now_add=True)
    game_lab_transfer = models.BooleanField(default = False,help_text = 'XP not counted')

    class Meta:
        ordering = ["time_approved","time_completed"]

    objects = QuestSubmissionManager()

    #other methods
    ....

有哪些策略可以解决这个问题?我尝试使用django的Paginator,但它似乎只显示在页面中,但它仍然加载整个查询集.

解决方法

首先要看的是:

>此查询是否因为返回非常大的结果集而变慢?

要么

>这个查询是否很慢,因为它需要一段时间才能过滤掉表格?

假设前者,除了“返回更少的数据”之外,你没有很多好的选择.

如果是后者,你可能应该在数据库上运行一个EXPLAIN,但是我会说你可能想要一个索引,可能是(is_approved,is_completed).可以通过以下方式完成:

class Meta:
    index_together = [
        ["is_completed","is_approved"],]

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读