Question

我一直在做一些休闲度假计算。我的迷你项目是对意大利“tomboli”游戏的模拟。一个关键的构建模块是对以下过程的模拟;

游戏由一个男人控制，一袋有90个大理石，编号为1到90.他从包中随机抽出弹珠，每次都向玩家打出大理石编号。

经过一番思考后，我为这个构建块编写了以下代码;

// NBR marbles, numbered 1...NBR are in a bag. Simulate randomly
//  pulling them from the bag, one by one, until the bag is empty
void bag( int random_sequence[NBR] )
{
    int i;

    // Store each marble as it is pulled out
    int *store = random_sequence;

    // Array of marbles still in the bag
    int not_yet_pulled[NBR];
    for( i=0; i<NBR; i++ )
        not_yet_pulled[i] = i+1;    // eg NBR=90; 1,2,3 ... 90

    // Loop pulling marbles from the bag, one each time through
    for( i=NBR; i>=1; i-- )
    {
        int x = rand();
        int idx = x%i;  // eg i=90 idx is random in range 0..89
                        // eg i=89 idx is random in range 0..88
                        //            ...
                        // eg i=1  idx is random in range 0..0
                        //    (so we could optimize when i=1 but not worth the bother)
        *store++  = not_yet_pulled[idx];

        // Replace the marble just drawn (so it cannot be pulled again)
        //     with the last marble in the bag. So;
        //     1) there is now one less marble in the bag
        //     2) only marbles not yet pulled are still in the bag
        // If we happened to pull the last marble in the *current subarray*, this is
        //    not required but does no harm.
        not_yet_pulled[idx] = not_yet_pulled[i-1];
    }
}

我知道在游戏模拟中随机数字存在细微之处和陷阱，所以虽然我对我的代码很满意，但我的信心略低于100％。所以我的问题是;

1）我的代码有什么问题吗？

2）[如果1的答案是否]我是否在不知不觉中使用标准的混洗算法？

3）[如果2的答案是否定]我的算法与标准替代方案相比如何？

修改感谢所有回答的人。我将接受Aidan Cully的回答，因为事实证明我正在重新发现Fisher-Yates算法，并揭示了这个问题的核心。当然，通过预先做一些研究，我可以节省自己的时间和精力也就不足为奇了。但另一方面，这是一个有趣的爱好项目。模拟的其余部分是常规的，这是最有趣的部分，而且我不会因为没有自己而去剥夺自己的乐趣。另外，我试图模拟一个男人从一个袋子里拿出弹珠，而且在这件作品中已经很晚了，我意识到情况与洗牌很相似。

另一个兴趣点是Ken有一个小缺陷，他指出经常重复模式rand（）％N并不是从0 ... N-范围内选择一个随机数的好方法。 1。

最后，我的Fisher-Yates版本缺乏优雅的技巧，可以实现随机播放的优良特性。结果，我的算法最终会得到一个同样随机但反向的混乱。

Answer 1

使用Fisher-Yates-Knuth shuffle：

public static void shuffle(int[] array) 
{
    Random rng = new Random();       // java.util.Random.
    // n is the number of items left to shuffle
    for (int n = array.length; n > 1; n--) 
    {
        // Pick a random element to move to the end
        int k = rng.nextInt(n);  // 0 <= k <= n - 1.
        // Simple swap of variables
        int tmp = array[k];
        array[k] = array[n - 1];
        array[n - 1] = tmp;
    }
}

看起来您的代码可能有效，但我不确定。它比标准算法更加模糊。

Answer 2

您正在使用Fisher-Yates shuffling algorithm。

Answer 3

int idx = x%i;  // eg i=90 idx is random in range 0..89

它在该范围内，但它不是均匀分布的，除非90（或NBR）除以max（rand（））。如果您使用的是2位计算机，那可能并非如此。例如，idx稍微更可能是0而不是89。

Answer 4

分析算法以检查它们是否真的是随机的非常困难除了拥有大学数学水平的人（或者像美国人所说的那样，数学专业），这甚至超出了大多数人的技能。

因此，您应该尝试使用已经构建的算法你看过std::random_shuffle()吗？

 void bag( int random_sequence[NBR] )
 {
     for(int i=0; i<NBR; ++i) 
     {    random_sequence[i] = i+1;
     }
     std::random_shuffle(random_sequence,random_sequence + NBR);
 }

从std :: random_shuffle（）页面引用：

该算法在Knuth的第3.4.2节（D.E.Knuth，The Art of Computer Programming。第2卷：Seminumerical Algorithms，第2版，Addison-Wesley，1981）中描述。 Knuth认为Moses和Oakford（1963）和Durstenfeld（1964）。注意有N！排列N个元素序列的方法。 Random_shuffle产生均匀分布的结果;也就是说，任何特定排序的概率是1 / N！。这个评论很重要的原因是有许多算法乍一看实现序列的随机混乱，但实际上并没有在N上产生均匀分布！可能的排序。也就是说，很容易让随机洗牌错误。

Answer 5

rand() % i的替代方案是(int) ((rand() / (double) (RAND_MAX+1)) * i)，它具有更好的近均匀分布（以牺牲性能为代价）。

或者，使用已知效果良好的伪随机数生成算法，例如Mersenne twister。

Answer 6

只有几个风格点：

您获取具有给定长度的数组的签名可能会产生错觉，即编译器保证参数至少包含IDX元素。不是。
我可能会给第二个for循环中的循环索引一个更具说服力的名称，比如marblesRemaining，所以它更清楚它是什么，不需要通过注释来解释。它也会将它与第一个循环中完全不同的用途分开。

Answer 7

除了随机数生成的狡辩，你的随机数算法看起来是正确的。

你可以改进它：通过一点点思考，你可以看到你可以将数字改组到位。因此，您可以只使用输出缓冲区而不是分配临时数组。

Answer 8

正如其他人已经评论过的那样，使用经过验证的改组算法。

值得注意的是，您的C / C ++库只提供伪随机数。

需要高可靠性的随机化算法的系统使用专用硬件来生成随机数。高端扑克网站就是一个很好的例子。例如，参见随机数生成技术Pokerstars writeup。

早期版本的Netscape加密被打破，因为黑客能够预测所使用的“随机”数字，因为伪随机数生成器是以当前时间播种的。请参阅此writeup on Wikipedia。

这个改组算法有什么问题吗？

8 个答案: