Swift相当于Python切片赋值

时间:2015-12-13 21:50:31

标签: python arrays swift performance swift2

在Python中,可以有一个列表(类似于swift中的数组):

>>> li=[0,1,2,3,4,5]

在任何/所有列表上执行切片分配:

>>> li[2:]=[99]         # note then end index is not needed if you mean 'to the end'
>>> li
[0, 1, 99]

Swift有一个类似的切片赋值(这是在swift交互式shell中):

  1> var arr=[0,1,2,3,4,5]
arr: [Int] = 6 values {
  [0] = 0
  [1] = 1
  [2] = 2
  [3] = 3
  [4] = 4
  [5] = 5
}
  2> arr[2...arr.endIndex-1]=[99]
  3> arr
$R0: [Int] = 3 values {
  [0] = 0
  [1] = 1
  [2] = 99
}

到目前为止,这么好。但是,有几个问题。

首先,swift不适用于空列表或索引位于endIndex之后。如果切片索引在结束索引之后,则附加Python:

>>> li=[]             # empty
>>> li[2:]=[6,7,8]
>>> li
[6, 7, 8]
>>> li=[0,1,2]
>>> li[999:]=[999]
>>> li
[0, 1, 2, 999]

swift中的等价物是一个错误:

  4> var arr=[Int]()
arr: [Int] = 0 values
  5> arr[2...arr.endIndex-1]=[99]
fatal error: Can't form Range with end < start

这很容易测试和编码。

第二个问题是杀手:它的速度非常慢。请考虑使用此Python代码来执行浮点列表的精确求和:

def msum(iterable):
    "Full precision summation using multiple floats for intermediate values"
    # Rounded x+y stored in hi with the round-off stored in lo.  Together
    # hi+lo are exactly equal to x+y.  The inner loop applies hi/lo summation
    # to each partial so that the list of partial sums remains exact.
    # Depends on IEEE-754 arithmetic guarantees.  See proof of correctness at:
    # www-2.cs.cmu.edu/afs/cs/project/quake/public/papers/robust-arithmetic.ps

    partials = []               # sorted, non-overlapping partial sums
    for x in iterable:
        i = 0
        for y in partials:
            if abs(x) < abs(y):
                x, y = y, x
            hi = x + y
            lo = y - (hi - x)
            if lo:
                partials[i] = lo
                i += 1
            x = hi
        partials[i:] = [x]
    return sum(partials, 0.0)

它的工作原理是保持hi / lo部分摘要,以便msum([.1]*10)完全生成1.0而不是0.9999999999999999msum的C等价物是Python中math library的一部分。

我试图在swift中复制:

func msum(it:[Double])->Double {
    // Full precision summation using multiple floats for intermediate values 
    var partials=[Double]()
    for var x in it {
        var i=0
        for var y in partials{
            if abs(x) < abs(y){
                (x, y)=(y, x)
            }
            let hi=x+y
            let lo=y-(hi-x)
            if abs(lo)>0.0 {
                partials[i]=lo
                i+=1
            }
            x=hi
        }
        // slow part trying to replicate Python's slice assignment partials[i:]=[x]
        if partials.endIndex>i {
            partials[i...partials.endIndex-1]=[x]
        }
        else {
            partials.append(x)
        }    
    } 
    return partials.reduce(0.0, combine: +)
}

测试功能和速度:

import Foundation
var arr=[Double]()
for _ in 1...1000000 {
    arr+=[10, 1e100, 10, -1e100]
    }

print(arr.reduce(0, combine: +))    // will be 0.0
var startTime: CFAbsoluteTime!
startTime = CFAbsoluteTimeGetCurrent()
print(msum(arr), arr.count*5)          // should be arr.count * 5
print(CFAbsoluteTimeGetCurrent() - startTime)

在我的机器上,需要7秒才能完成。 Python原生msum需要2.2秒(大约快4倍),库fsum功能需要0.09秒(几乎快90倍)

我尝试将partials[i...partials.endIndex-1]=[x]替换为arr.removeRange(i..<arr.endIndex),然后附加。快一点但不多。

问题:

  1. 这是惯用的快速:partials[i...partials.endIndex-1]=[x]
  2. 有更快/更好的方法吗?

2 个答案:

答案 0 :(得分:5)

首先(正如评论中所说),有一个巨大的 Swift中非优化和优化代码之间的区别 (“-Onone”vs“-O”编译器选项,或Debug与Release配置),因此对于性能测试,请确保“Release”配置 被选中。 (如果您,“发布”也是默认配置 用仪器来描述代码。

使用半开范围

有一些优点
var arr = [0,1,2,3,4,5]
arr[2 ..< arr.endIndex] = [99]
print(arr) // [0, 1, 99]

事实上,这是一个范围在内部存储的方式,它允许你 在数组的末尾插入一个切片(但不会超出Python中的那个):

var arr = [Int]()
arr[0 ..< arr.endIndex] = [99]
print(arr) // [99]

所以

if partials.endIndex > i {
    partials[i...partials.endIndex-1]=[x]
}
else {
    partials.append(x)
} 

相当于

 partials[i ..< partials.endIndex] = [x]
 // Or: partials.replaceRange(i ..< partials.endIndex, with: [x])

但是,这不是性能提升。看起来 在Swift中替换切片很慢。截断数组和 用

附加新元素
partials.replaceRange(i ..< partials.endIndex, with: [])
partials.append(x)

将我的测试代码的时间从大约1.25减少到0.75秒 计算机。

答案 1 :(得分:4)

正如@MartinR指出的那样,replaceRange比切片分配更快。

如果你想要最高速度(基于我的测试),最好的选择可能是:

partials.replaceRange(i..<partials.endIndex, with: CollectionOfOne(x))

CollectionOfOne[x]快,因为它只是将元素内联存储在结构中,而不是像数组那样分配内存。