Python计时 - 必须有更好的方法!

时间:2010-11-11 22:43:06

标签: python performance testing timing

我希望有人可以帮我解决这个问题。 我想测量排序算法。以下是我目前的工作方式:

M = 1000 # number of executions
N = [1000, 2000, 4000, 16000] # size of the list
L = [100, 1000, 2000,16000] # max element of the list

# timing:
print 'Number of executions: %i' % (M)
print '-'*80
print '\tL\N\t|\t%i\t|\t%i\t|\t%i\t|\t%i' % (N[0], N[1], N[2], N[3])
print '-'*80
for l in L:
    print '\t%i\t' % l,
    for n in N: 
        t = 0
        for m in xrange(M):
            A = [random.randint(0,l-1) for r in xrange(n)] # generates an n long random list
            t0 = time.clock()
            pass # sort function call goes here
            t1 = time.clock()
            t += (t1-t0)
        print '|\t%0.3f\t' % ((t*1000.0)/M ), # avg time
    print
print '-'*80

此空测试大约需要4分钟。如果能让它更快,我将不胜感激。

干杯

修改 在Rafe Kettler的暗示之后,我想出了这个:

def sorting(LST):
    pass

if __name__ == "__main__" :
    M = 1000
    N = [1000, 2000, 4000, 16000]
    L = [100, 1000, 2000,16000]

    print 'Number of executions: %i' % (M)
    print '-'*80
    print '\tL\N\t|\t%i\t|\t%i\t|\t%i\t|\t%i' % (N[0], N[1], N[2], N[3])
    print '-'*80
    for l in L:
        print '\t%i\t' % l,
        for n in N:
            #------------------------
            t = timeit.Timer('sorting([random.randint(0,l-1) for r in xrange(n)])', 'from __main__ import sorting, n, l, random')
            #------------------------
            print '|\t%0.3f\t' % (t.timeit(M)/M ), # avg time
        print
    print '-'*80

不幸的是它变慢了。我做错了什么?

5 个答案:

答案 0 :(得分:13)

timeit。期间Python的最佳时间。将算法重构为函数,并使用timeit来测试执行时间。

答案 1 :(得分:2)

您可以替换此代码:

A = [random.randint(0,l-1) for r in xrange(n)]

用发电机?例如

def A(n):
    for r in xrange(n):
        yield random.randint(0,l-1)

我认为,空检测的大部分时间都是随机列表生成

答案 2 :(得分:1)

创建随机数是一项耗时的任务。你正在创建它们的4 * 1000 *(1000 + 2000 + 4000 + 16000)。最简单的测试用例在我的系统上花费超过7分钟:

>>> t=timeit.Timer('random.randint(0,15999)','import random')
>>> t.timeit(4*1000*(1000+2000+4000+16000))
447.08869618904077

正如我在评论中所说,从被测算法的时间中排除创建测试数据的时间非常重要

答案 3 :(得分:0)

生成一次随机数。将它们放在搁架或腌制文件中,然后在需要进行测试时将它们读出来。

答案 4 :(得分:0)

不完全回答timimg问题,但你可以使用numpy包中的随机模块非常有效地生成大量随机数:

>>> from numpy import random
>>> l = 100; n = 16000
>>> random.randint(0,l-1,n)

调整OP的脚本,下面是使用numpy.random v.s对总时间的比较。股票随机模块:

numpy.random
number of executions: 1000
--------------------------------------------------------------------------------
        L\N     |       1000    |       2000    |       4000    |       16000
--------------------------------------------------------------------------------
        100     |       0.022   |       0.043   |       0.084   |       0.332
        1000    |       0.016   |       0.031   |       0.059   |       0.231
        2000    |       0.016   |       0.030   |       0.059   |       0.231
        16000   |       0.016   |       0.030   |       0.059   |       0.231
--------------------------------------------------------------------------------

random 
Number of executions: 1000
--------------------------------------------------------------------------------
        L\N     |       1000    |       2000    |       4000    |       16000
--------------------------------------------------------------------------------
        100     |       2.152   |       4.271   |       8.649   |       34.007
        1000    |       2.264   |       4.501   |       8.762   |       34.956
        2000    |       2.202   |       4.412   |       8.743   |       34.818
        16000   |       2.205   |       4.398   |       8.735   |       34.823
--------------------------------------------------------------------------------