为什么`注入'非常慢?

时间:2013-04-05 08:05:56

标签: ruby benchmarking

这是基准

require 'benchmark'

# create random array
arr = 40000.times.map { rand(100000).to_s }

r1 = ''
r2 = ''
r3 = ''

Benchmark.bm do |x|
    x.report {
        r1 = (arr.map { |s|
            "[#{s}]"
        }).join
    }

    x.report {
        r2 = arr.inject('') { |memo, s|
            memo + "[#{s}]"
        }
    }

    x.report {
        r3 = ''
        arr.each { |s|
            r3 << "[#{s}]"
        }
    }
end

# confirm result is same
puts r1 == r2
puts r2 == r3

这是结果

       user     system      total        real
   0.047000   0.000000   0.047000 (  0.046875)
   5.031000   0.844000   5.875000 (  5.875000)
   0.031000   0.000000   0.031000 (  0.031250)
true
true

有没有办法让inject更快?

1 个答案:

答案 0 :(得分:6)

这是我的猜测:与其他两种方法不同,inject方法不断创建越来越大的字符串。所有这些(除了最后一个)都是临时的,必须进行垃圾收集。这就浪费了内存和CPU。这也是Shlemiel the Painter's algorithm的一个很好的例子。

  

...... Spolsky打算类比的效率低下是C样式的空终止字符数组(即字符串)重复串联的糟糕编程实践,其中必须重新计算目标字符串的位置每次从字符串的开头,因为它不是从先前的串联中继承而来的。 ...

使用map的方法创建了许多小字符串,因此,至少,它不会花费太多时间来分配内存。

更新

正如Yevgeniy Anfilofyev在评论中指出的那样,你可以通过不创造任何大字符串来避免创建许多大字符串。只需继续追加到memo

r2 = arr.inject('') { |memo, s|
  memo << "[#{s}]"
}

这是有效的,因为String#+String#<<都会为字符串返回一个新值。