python deepcopy比自定义代码更有效,还是更低效/可预测?

时间:2013-12-25 12:39:54

标签: python

我有一个dict,其值是非嵌套列表(具体来说,键是整数,值是整数列表)。我想对它进行深层复制,以便我不修改原始字典中的列表。

我知道我可以使用

copied = copy.deepcopy(original)

但是,由于我知道数据结构的形式,我也可以使用

之类的东西
copied = {key:valuelist[:] for (key,valuelist) in original.iteritems()}

其中一种解决方案更好吗?更高效?不太可能导致令人讨厌的惊喜?

我被告知deepcopy()附带了一些问题,但我真的不明白。我还想了解使用deepcopy()的效率是否低于我的代码(可能是因为它是一种更通用的解决方案?)或更高效(可能是在较低级别进行了优化?)。

3 个答案:

答案 0 :(得分:4)

正如您所料,copy.deepcopy比第二种解决方案慢:

$ python -m timeit "original = {x: range(10) for x in xrange(10)}; copy = {x: v[:] for x,v in original.iteritems()}"
100000 loops, best of 3: 5.41 usec per loop

$ python -m timeit "original = {x: range(1000) for x in xrange(1000)}; copy = {x: v[:] for x,v in original.iteritems()}"
100 loops, best of 3: 17.1 msec per loop

$ python -m timeit "import copy; original = {x: range(10) for x in xrange(10)}; c = copy.deepcopy(original)"
10000 loops, best of 3: 86.4 usec per loop

$ python -m timeit "import copy; original = {x: range(1000) for x in xrange(1000)}; c = copy.deepcopy(original)"
10 loops, best of 3: 1.4 sec per loop

deepcopy比dict理解+列表副本慢得多的原因是:

  • deepcopy是多用途功能 - 它适用于任何类型的对象
  • deepcopy在python中实现,而dict理解和列表切片在较低级别完成

最强烈的

  • deepcopy递归地复制容器内的元素,而你的字典理解

示例:

>>> import copy
>>> obj = object()
>>> original = {x: [obj] * 10 for x in xrange(10)}
>>> copy1 = {x:v[:] for x,v in original.iteritems()}
>>> copy2 = copy.deepcopy(original)
>>> copy1[0][0] is original[0][0]
True
>>> copy2[0][0] is original[0][0]
False

如您所见,deepcopy复制了obj中包含的original,以便copy2列表包含其副本,而不是obj本身。与你的dict理解不同,它在创建新的列表对象时保留了列表中的元素。

答案 1 :(得分:2)

我使用下面的代码,得到一些结果

import copy
import time

def go(loop):
    original = {x: [y for y in range(x)] for x in xrange(100)}
    print loop

    start = time.time()
    for x in xrange(loop):
        copied = copy.deepcopy(original)
    print 'deepcopy %ss' % (time.time() - start)

    start = time.time()
    for x in xrange(loop):
        copied = {k: v[:] for (k,v) in original.iteritems()}
    print 'custome  %ss' % (time.time() - start)

    print ''

for x in (100, 1000, 10000):
    go(x)


result

100
deepcopy 0.47200012207s
custome  0.00699996948242s

1000
deepcopy 4.69200015068s
custome  0.0620000362396s

10000
deepcopy 47.7449998856s
custome  0.677999973297s
显然,copy.deepcopy更糟糕。我认为它处理的不仅仅是自定义方法

答案 2 :(得分:0)

我的建议是暂时使用deepcopy,如果结果太慢,您可以随时将其替换为自定义函数。

如果你的dict真的很大,它可能会变慢,但只要你不使用非常大的数据,我就不会太担心。

相关问题