访问外键时使用代理模型

时间:2013-02-11 23:16:34

标签: django django-models

我有两个相关的Django模型。其中一个模型在其__init__中进行了昂贵的计算,如果没有不可接受的成本/风险,我无法移动到其他地方。

事实证明,在所有情况下都不需要这些昂贵的计算,因此我引入了一种绕过它们的代理模型。但是,它们经常被需要,因此将昂贵的代码放入代理中是不切实际的。

所以,我的代码基本上是这样的:

class Person(models.Model):
  def __init__(self, *args, **kw):
    models.Model.__init__(self, *args, **kw)
    do_some_really_expensive_things()

class LightweightPerson(Person):
  class Meta:
    proxy = True

  def __init__(self, *args, **kw):
    models.Model.__init__(self, *args, **kw)

class PersonFact(models.Model):
  fact = models.TextField()
  person = models.ForeignKey(Person)

这很有效 - 我在Person上的大多数代码查询。在代码不需要真正昂贵的东西的少数地方,它会在LightweightPerson上进行查询,而且效果会更好。

但是,我的一些代码从PersonFact个实例开始,并为每个person访问相关的PersonFact。此代码不需要真正昂贵的人员计算,并且从那些昂贵的计算中获得的性能是不可接受的。因此,我希望能够在此上下文中实例化LightweightPerson而不是Person

我提出的方法是添加引用代理类的第二个ForeignKey,并使用相同的数据库列:

class PersonFact(models.Model):
  fact = models.TextField()
  person = models.ForeignKey(Person, db_column="person_id")
  lightweight_person = models.ForeignKey(
     LightweightPerson, db_column="person_id", 
     related_name="lightweight_personfact_set")

所以现在当我需要性能提升时,我的代码可以做到这样的事情:

facts = PersonFact.objects.select_related(
             "lightweight_person").all()
for fact in facts:
  do_something_with(fact.lightweight_person)

这很棒!直到我尝试保存新的PersonFact

>>> fact = PersonFact(fact="I like cheese", person=some_guy_i_know)
>>> fact.save()
Traceback (most recent call last):
...
DatabaseError: column "person_id" specified more than once

: - (

如果没有对Person.__init__目前的代码进行大规模的重构,有没有办法做到这一点?理想情况下,我或者能够立即发出信号“在立即访问person_fact.person时,请在我的调用代码中实例化LightweightPerson而不是Person”。或者,或者,我希望能够在PersonFact上声明一个影响同一数据库列的“代理相关字段”,但Django的内部知道只与数据库列进行一次交互。

1 个答案:

答案 0 :(得分:0)

我到目前为止提出的最佳解决方案是对相关模型的__init__做一些可怕的事情:

class PersonFact(models.Model):
  fact = models.TextField()
  person = models.ForeignKey(Person, db_column="person_id")
  lightweight_person = models.ForeignKey(
     LightweightPerson, db_column="person_id", 
     related_name="lightweight_personfact_set")

def __init__(self, *args, **kw):
    models.Model.__init__(self, *args, **kw)
    index = None
    for i, field in enumerate(self._meta.local_fields):
        if field.name == 'lightweight_person':
            index = i
            break
    if index is not None:
        self._meta.local_fields.pop(index)

这显然隐藏了对象管理器中该字段的存在以进行更新和插入,因此不会出现“多次指定列”错误;当我选择现有数据时,该字段仍会填充。

这似乎有效,但它非常可怕 - 我不知道它是否会在我的代码的其他部分产生副作用。