检查两个数组是否具有相同的内容(按任何顺序)

时间:2012-06-06 18:14:45

标签: ruby arrays comparison

我正在使用带有Rails 1.2.3的Ruby 1.8.6,并且需要确定两个数组是否具有相同的元素,无论它们是否处于相同的顺序。其中一个数组保证不包含重复项(另一个可能,在这种情况下答案是否定的)。

我的第一个想法是

require 'set'
a.to_set == b.to_set

但我想知道是否有更有效或惯用的方法。

9 个答案:

答案 0 :(得分:118)

这不需要转换为设置:

a.sort == b.sort

答案 1 :(得分:37)

对于两个数组A和B: A和B具有相同的内容,如果: (A-B).blank? and (B-A).blank?

或者你可以检查: ((A-B) + (B-A)).blank?

同样如@ cort3z所建议的那样,这个解决方案als0适用于多态数组,即

 A = [1 , "string", [1,2,3]]
 B = [[1,2,3] , "string", 1]
 (A-B).blank? and (B-A).blank? => true
 # while A.uniq.sort == B.uniq.sort will throw error `ArgumentError: comparison of Fixnum with String failed` 

:::::::::::编辑:::::::::::::

正如评论中所建议的那样,上述解决方案无法复制。虽然问题甚至不是必需的,因为提问者对重复不感兴趣(他在检查之前将其数组转换为设置并且掩盖了重复,即使你看看他在检查之前使用.uniq运算符的加速答案,这也掩盖了重复。)。但是,如果重复你感兴趣,只需添加一个计数检查将修复相同(根据问题只有一个数组可以包含重复)。所以最终的解决方案是: A.size == B.size and ((A-B) + (B-A)).blank?

答案 2 :(得分:19)

速度比较

require 'benchmark/ips'
require 'set'

a = [1, 2, 3, 4, 5, 6]
b = [1, 2, 3, 4, 5, 6]

Benchmark.ips do |x|
  x.report('sort')   { a.sort == b.sort }  
  x.report('sort!')  { a.sort! == b.sort! }  
  x.report('to_set') { a.to_set == b.to_set }  
  x.report('minus')  { ((a - b) + (b - a)).empty? }  
end  

Warming up --------------------------------------
            sort    88.338k i/100ms
           sort!   118.207k i/100ms
          to_set    19.339k i/100ms
           minus    67.971k i/100ms
Calculating -------------------------------------
            sort      1.062M (± 0.9%) i/s -      5.389M in   5.075109s
           sort!      1.542M (± 1.2%) i/s -      7.802M in   5.061364s
          to_set    200.302k (± 2.1%) i/s -      1.006M in   5.022793s
           minus    783.106k (± 1.5%) i/s -      3.942M in   5.035311s

答案 3 :(得分:14)

ab的元素为Comparable时,

a.sort == b.sort

根据@ steenslag的评论修正@ mori的答案

答案 4 :(得分:7)

如果您预期[:a, :b] != [:a, :a, :b] to_set不起作用。您可以改用频率:

class Array
  def frequency
    p = Hash.new(0)
    each{ |v| p[v] += 1 }
    p
  end
end

[:a, :b].frequency == [:a, :a, :b].frequency #=> false
[:a, :b].frequency == [:b, :a].frequency #=> true

答案 5 :(得分:6)

如果您知道数组长度相等且两个数组都不包含重复项,那么这也适用:

( array1 & array2 ) == array1

说明:在这种情况下&运算符返回a1的副本sans没有在a2中找到的任何项目,如果两个数组具有相同的内容,则与原始a1相同没有重复。

分析:鉴于订单没有改变,我猜这是一次双重迭代实现O(n*n),对于大型数组来说明显比a1.sort == a2.sort更差。应该用最坏情况O(n*logn)执行。

答案 6 :(得分:2)

Ruby 2.6 +

Ruby在2.6中引入了difference

这提供了一个非常快速,易读的解决方案,如下所示:

a = [1, 2, 3, 4, 5, 6]
b = [1, 2, 3, 4, 5, 6]

a.difference(b).any?
# => false
a.difference(b.reverse).any?
# => false

a = [1, 2, 3, 4, 5, 6]
b = [1, 2, 3]
a.difference(b).any?
# => true

运行基准测试

a = Array.new(1000) { rand(100) }
b = Array.new(1000) { rand(100) }

Benchmark.ips do |x|
  x.report('sort')   { a.sort == b.sort }  
  x.report('sort!')  { a.sort! == b.sort! }  
  x.report('to_set') { a.to_set == b.to_set }  
  x.report('minus')  { ((a - b) + (b - a)).empty? }  
  x.report('difference') { a.difference(b).any? }
end

      sort     13.908k (± 2.6%) i/s -     69.513k in   5.001443s
     sort!     14.656k (± 3.0%) i/s -     73.736k in   5.035744s
    to_set     5.125k  (± 2.9%) i/s -     26.023k in   5.082083s
     minus     16.398k (± 2.2%) i/s -     83.181k in   5.074938s
difference     27.839k (± 5.2%) i/s -    141.048k in   5.080706s

希望对某人有帮助!

答案 7 :(得分:1)

一种方法是迭代数组而不重复

# assume array a has no duplicates and you want to compare to b
!a.map { |n| b.include?(n) }.include?(false)

这将返回一个trues数组。如果出现任何错误,则外部include?将返回true。因此,您必须反转整个事物以确定它是否匹配。

答案 8 :(得分:1)

结合&size可能也很快。

require 'benchmark/ips'
require 'set'

Benchmark.ips do |x|
  x.report('sort')   { a.sort == b.sort }  
  x.report('sort!')  { a.sort! == b.sort! }  
  x.report('to_set') { a.to_set == b.to_set }  
  x.report('minus')  { ((a - b) + (b - a)).empty? }
  x.report('&.size') { a.size == b.size && (a & b).size == a.size }  
end  

Calculating -------------------------------------
                sort    896.094k (±11.4%) i/s -      4.458M in   5.056163s
               sort!      1.237M (± 4.5%) i/s -      6.261M in   5.071796s
              to_set    224.564k (± 6.3%) i/s -      1.132M in   5.064753s
               minus      2.230M (± 7.0%) i/s -     11.171M in   5.038655s
              &.size      2.829M (± 5.4%) i/s -     14.125M in   5.010414s
相关问题