关于马尔可夫链的困惑

时间:2016-12-01 10:13:30

标签: machine-learning

马尔可夫链方法和条件概率这两件事情有关吗?如果他们碰巧有关系;请解释一下它们之间的关系。

2 个答案:

答案 0 :(得分:2)

马尔可夫链和条件概率试图回答不同的问题。然而,它们在某种意义上是相关的。

在马尔可夫链中,我们看一下具有状态和状态转换的系统。 事件触发状态转换,事件的概率可能取决于系统所处的状态 - 这就是条件概率发挥作用的地方。

让我们先看看下面的例子,首先掌握条件概率:

条件概率可以定义为: P(A|B) := P( A AND B ) / P(B)

用语言:假设事件B已经发生,事件A发生的概率有多大?

示例:盒子里的球:

让盒子中有(R)ed,(B)lue(L)ight和(H)eavy球。 球可以重或轻,红色或蓝色。

    Balls  | Light | Heavy | Total
   ------------------------------------
   Red     | 10   |  20    |  30
   Blue    | 30   |  40    |  70
   Total   | 40   |  60    |  100

拾取P(X)的概率,其中X表示(R)ed,(B)lue,(H)eavy或(L)ight,红色和浅(RL)红色和重(RH)等。 ..以下是:

    Event |  N | Total | P     
   ----------------------------
      R   | 30 |  100  | 0.3   
      B   | 70 |  100  | 0.7  
      L   | 40 |  100  | 0.4
      H   | 60 |  100  | 0.6
      RL  | 10 |  100  | 0.1
      RH  | 20 |  100  | 0.2
      BL  | 30 |  100  | 0.3
      BH  | 40 |  100  | 0.4

如果我们遇到如下问题,我们会讨论条件概率:

如果我们已经选了一个重球,那么有蓝球的概率是多少?

P(B | H)= P(B和H)/ P(H)= #BH / #H = 40/60 = 2/3

马尔可夫链有点不同:

对于马尔可夫链的示例,我们需要稍微不同的实验。

想象一下两个盒子的设置;一个带(L)ight球,一个带(H)球状球。

实验:

  • 选择N个球,然后将它们放回盒子里。

  • 从方框(L)开始

  • 如果选择了(B)球,则从(H)eavy Box中挑选一个球。

  • 如果选择(R)球,则从(L)ight Box中选择一个球。

问题:第n球重的可能性有多大?

在处理马尔可夫链时,我们首先尝试构建状态机: 州(L)意味着你从带有轻球的盒子中挑选 挑球的结果可能导致过渡到同一个州或不同的州。 转换将表示为{R,B},并将其概率表示为括号。

            +-----+    R(2/4)           +-----+
            |     |<------------------- |     |
  .-------->|     |                     |     | <------.
  \R(1/4)   |  L  |    B(3/4)           |  H  |       /  B(4/6)
   \--------|     | ------------------->|     | -----/
            +-----+                     +-----+

现在我们可以将状态表示为向量和所有转换以及它们作为矩阵的概率。在一步(N = 1)之后,我们将处于以下状态:

          ^N
|1/4  2/6|    |1|    |1/4|    | L |
|        | x  | |  = |   |  = |   |
|3/4  4/6|    |0|    |3/4|    | H |

因此处于状态L的可能性是1/4而状态H是3/4。 如果N = 1000,我们只需重新应用转换矩阵1000次, 这与将矩阵提升到1000次幂并应用于状态向量相同。在1000步之后,处于状态L的概率将是~0.31并且H~0.69。

注意:

  • 通过设计,矩阵的条目是第一个问题的条件概率。

  • 矩阵的n次方收敛,因此在无限步之后处于某种状态的概率。

答案 1 :(得分:1)

  

在概率论中,条件概率是对事件发生概率的一种度量(假设,假设,断言或证据)已经发生了另一事件。

给定B的条件概率通常写为P(A | B)

让我们去马尔可夫链

  

如果一个人只能根据其现状来预测流程的未来,并且可以了解流程的完整历史,那么流程就会满足Markov属性。即,以系统的现状为条件,其未来和过去是独立的。

定义变量:

A - 流程的当前状态

B - 预测过程的状态

即使是未来和过去的独立我们也有现状和预测IS依赖于当前状态作为条件。所以我们可以把它写成P(A | B),它是条件概率定义。