解决实现ISerializable的对象的循环引用

时间:2010-04-26 09:43:03

标签: .net serialization circular-reference iserializable

我正在编写自己的IFormatter实现,我想不出一种方法来解决两种实现ISerializable的类型之间的循环引用。

这是通常的模式:

[Serializable]
class Foo : ISerializable
{
    private Bar m_bar;

    public Foo(Bar bar)
    {
        m_bar = bar;
        m_bar.Foo = this;
    }

    public Bar Bar
    {
        get { return m_bar; }
    }

    protected Foo(SerializationInfo info, StreamingContext context)
    {
        m_bar = (Bar)info.GetValue("1", typeof(Bar));
    }

    public void GetObjectData(SerializationInfo info, StreamingContext context)
    {
        info.AddValue("1", m_bar);
    }
}

[Serializable]
class Bar : ISerializable
{
    private Foo m_foo;

    public Foo Foo
    {
        get { return m_foo; }
        set { m_foo = value; }
    }

    public Bar()
    { }

    protected Bar(SerializationInfo info, StreamingContext context)
    {
        m_foo = (Foo)info.GetValue("1", typeof(Foo));
    }

    public void GetObjectData(SerializationInfo info, StreamingContext context)
    {
        info.AddValue("1", m_foo);
    }
}

然后我这样做:

Bar b = new Bar();
Foo f = new Foo(b);
bool equal = ReferenceEquals(b, b.Foo.Bar); // true

// Serialise and deserialise b

equal = ReferenceEquals(b, b.Foo.Bar);

如果我使用开箱即用的BinaryFormatter来序列化和反序列化b,那么引用相等的上述测试会像人们期望的那样返回true。但我无法想象在我的自定义IFormatter中实现这一目标的方法。

在非ISerializable情况下,一旦目标引用被解析,我就可以使用反射简单地重新访问“待定”对象字段。但是对于实现ISerializable的对象,不可能使用SerializationInfo注入新数据。

有人能指出我正确的方向吗?

2 个答案:

答案 0 :(得分:5)

这种情况是FormatterServices.GetUninitializedObject方法的原因。一般的想法是,如果对象A和B在SerializationInfo中相互引用,则可以按如下方式对它们进行反序列化:

(出于解释的目的,(SI,SC)指的是类型的反序列化构造函数,即带有SerializationInfoStreamingContext的构造函数。)

  1. 首先选择一个对象进行反序列化。只要你不挑选一个值类型的东西,你选择哪个都没关系。让我们说你选择A。
  2. 调用GetUninitializedObject 分配(但不初始化)A类型的实例,因为您尚未准备好调用其(SI,SC)构造函数。
  3. 以通常的方式构建B,即创建一个SerializationInfo对象(包括对现在半反序列化的A的引用)并将其传递给B的(SI,SC)构造函数。
  4. 现在,您拥有初始化所分配的A对象所需的所有依赖项。创建它的SerializationInfo对象并调用A的(SI,SC)构造函数。您可以通过反射在现有实例上调用构造函数。
  5. GetUninitializedObject方法是纯粹的CLR魔法 - 它创建一个实例,而无需调用构造函数来初始化该实例。它基本上将所有字段设置为零/ null。

    这是警告您不要在(SI,SC)构造函数中使用子对象的任何成员的原因 - 可以分配子对象但在此时尚未初始化。这也是IDeserializationCallback接口的原因,它允许您在保证完成所有对象初始化之后和返回反序列化对象图之前使用子对象。

    ObjectManager课程可以为您完成所有这些(以及其他类型的修复)。但是,考虑到反序列化的复杂性,我总是发现它的文档记录很少,所以我从来没有花时间试图弄清楚如何正确使用它。它使用一些魔法来执行第4步,使用一些优化的内部到CLR反射来更快地调用(SI,SC)构造函数(我的时间大约是公共方式的两倍)。

    最后,有些对象图涉及无法反序列化的循环。一个例子是当你有两个IObjectReference个实例的循环时(我已经测试了BinaryFormatter并且它抛出异常)。另一个我怀疑是你有一个cycle involving nothing but boxed value-types

答案 1 :(得分:0)

您需要检测到您在对象图中多次使用同一个对象,标记输出中的每个对象,当您出现#2或更高版本时,需要输出“引用”现有标签而不是对象再次出现。

序列化的伪代码:

for each object
    if object seen before
        output tag created for object with a special note as "tag-reference"
    else
        create, store, and output tag for object
        output tag and object

反序列化的伪代码:

while more data
    if reference-tag to existing object
        get object from storage keyed by the tag
    else
        construct instance to deserialize into
        store object in storage keyed by deserialized tag
        deserialize object

按照指定的顺序执行最后的步骤非常重要,这样才能正确处理这种情况:

SomeObject obj = new SomeObject();
obj.ReferenceToSomeObject = obj;    <-- reference to itself

即。在完全反序列化后,您无法将对象存储到标记存储中,因为在对其进行反序列化时,可能需要在存储中引用它。