Hashtbl.find对性能有多大影响?

时间:2019-04-15 12:07:12

标签: ocaml

当我用Hashtbl.find测量执行时间时,程序要比不使用它慢16倍。这是为什么?

请注意,无论是否使用查找表(MapObject),Node中的等效代码都没有太大的区别(仅慢3倍)

OCaml代码:

let fib =
  let table  = Hashtbl.create 1000 in
  let rec f n =
    try Hashtbl.find table n 
    with Not_found -> (
      match n with
      | 0 -> 0
      | 1 -> 1
      | n ->
          let r = f (n - 1) + f (n - 2) in
          (* Hashtbl.add table n r ; *)
          r 
    )
  in
  f

Hashtbl.add被有意评论,我只是对他的哈希表find的性能成本感兴趣。

1 个答案:

答案 0 :(得分:5)

Hashtbl.find函数即使应用于空哈希表也不是免费的,因为它会计算提供的键的哈希值。由于您使用的是多态哈希表实现,因此将使用通用(在C中实现)哈希函数。所有这些都会给Fibonacci函数的默认有效载荷带来一些开销,这仅是三个算术运算(即20x3 = 60算术运算的开销)。

如果我们将使用函子接口提供更有效的哈希函数,我们将把开销减少到接近x3的水平:

module Table = Hashtbl.Make(struct
    type t = int
    let equal : int -> int -> bool = fun x y -> x = y [@@inline]
    let hash x = x [@@inline]
  end)

let table  = Table.create 127

let fib1 x =
  let rec f n = match n with
    | 0 -> 0
    | 1 -> 1
    | n -> match Table.find_opt table n with
      | Some x -> x
      | None ->
        let r = f (n - 1) + f (n - 2) in
        (* Hashtbl.add table n r ; *)
        r in
  f x

请注意,我也从使用异常切换为选项类型。在递归函数内部设置异常处理程序意味着每次递归调用都会产生额外的开销。基本上,try语句具有运行时成本。

如果我们比较哈希表(fib1和没有哈希表(fib2)的实现的运行时间,我们将获得以下数字(以毫秒为单位,在我的2Ghz机器上,n = 32)

fib1: 53.3791
fib2: 18.1501

这给我们带来了x3的开销(在斐波那契内核本身之上有6个算术运算),这或多或少地对应于模运算(两个算术运算)以及三个额外的调用(查找本身)的开销。 ,我们的hash函数和Array.length函数。

您还可以尝试使用Janestreet Core库提供的哈希表实现,该实现通常效率更高。