“Scala编程”中的合并排序会导致堆栈溢出

时间:2010-02-04 16:49:56

标签: scala recursion stack-overflow

直接剪切和粘贴以下算法:

def msort[T](less: (T, T) => Boolean)
            (xs: List[T]): List[T] = {
  def merge(xs: List[T], ys: List[T]): List[T] =
    (xs, ys) match {
      case (Nil, _) => ys
      case (_, Nil) => xs
      case (x :: xs1, y :: ys1) =>
        if (less(x, y)) x :: merge(xs1, ys)
        else y :: merge(xs, ys1)
    }
  val n = xs.length / 2
  if (n == 0) xs
  else {
    val (ys, zs) = xs splitAt n
     merge(msort(less)(ys), msort(less)(zs))
  }
}

在5000个长列表上导致StackOverflowError。

有没有办法对此进行优化,以免发生这种情况?

3 个答案:

答案 0 :(得分:17)

这样做是因为它不是尾递归的。您可以通过使用非严格集合或使其尾递归来解决此问题。

后一种解决方案是这样的:

def msort[T](less: (T, T) => Boolean) 
            (xs: List[T]): List[T] = { 
  def merge(xs: List[T], ys: List[T], acc: List[T]): List[T] = 
    (xs, ys) match { 
      case (Nil, _) => ys.reverse ::: acc 
      case (_, Nil) => xs.reverse ::: acc
      case (x :: xs1, y :: ys1) => 
        if (less(x, y)) merge(xs1, ys, x :: acc) 
        else merge(xs, ys1, y :: acc) 
    } 
  val n = xs.length / 2 
  if (n == 0) xs 
  else { 
    val (ys, zs) = xs splitAt n 
    merge(msort(less)(ys), msort(less)(zs), Nil).reverse
  } 
} 

使用非严格性涉及按名称传递参数,或使用非严格的集合,例如Stream。以下代码仅使用Stream来防止堆栈溢出,并使用List其他地方:

def msort[T](less: (T, T) => Boolean) 
            (xs: List[T]): List[T] = { 
  def merge(left: List[T], right: List[T]): Stream[T] = (left, right) match {
    case (x :: xs, y :: ys) if less(x, y) => Stream.cons(x, merge(xs, right))
    case (x :: xs, y :: ys) => Stream.cons(y, merge(left, ys))
    case _ => if (left.isEmpty) right.toStream else left.toStream
  }
  val n = xs.length / 2 
  if (n == 0) xs 
  else { 
    val (ys, zs) = xs splitAt n 
    merge(msort(less)(ys), msort(less)(zs)).toList
  } 
}

答案 1 :(得分:6)

只是玩scala的TailCalls(蹦床支持),我怀疑这个问题最初提出时并不存在。这是Rex's answer中合并的递归不可变版本。

import scala.util.control.TailCalls._

def merge[T <% Ordered[T]](x:List[T],y:List[T]):List[T] = {

  def build(s:List[T],a:List[T],b:List[T]):TailRec[List[T]] = {
    if (a.isEmpty) {
      done(b.reverse ::: s)
    } else if (b.isEmpty) {
      done(a.reverse ::: s)
    } else if (a.head<b.head) {
      tailcall(build(a.head::s,a.tail,b))
    } else {
      tailcall(build(b.head::s,a,b.tail))
    }
  }

  build(List(),x,y).result.reverse
}

在64位OpenJDK上的Scala 2.9.1上的大List[Long]上的可变版本运行速度和i7上的Debian / Squeeze amd64一样快。

答案 2 :(得分:3)

为了防止Daniel的解决方案没有说清楚,问题是merge的递归与列表的长度一样深,并且它不是尾递归,所以它不能转换为迭代。

Scala可以将Daniel的尾递归合并解决方案转换为与此大致相当的东西:

def merge(xs: List[T], ys: List[T]): List[T] = {
  var acc:List[T] = Nil
  var decx = xs
  var decy = ys
  while (!decx.isEmpty || !decy.isEmpty) {
    (decx, decy) match { 
      case (Nil, _) => { acc = decy.reverse ::: acc ; decy = Nil }
      case (_, Nil) => { acc = decx.reverse ::: acc ; decx = Nil }
      case (x :: xs1, y :: ys1) => 
        if (less(x, y)) { acc = x :: acc ; decx = xs1 }
        else { acc = y :: acc ; decy = ys1 }
    }
  }
  acc.reverse
}

但它会跟踪所有变量。

(尾递归方法是 方法调用自身以获得完整回传的方法;它从不调用自身,然后在传回之前对结果做一些事情。如果方法可能是多态的,则不能使用tail-recursion,因此它通常只适用于对象或标记为final的类。)