随机森林中的 random_state

时间:2020-12-20 12:53:05

标签: python data-science random-forest random-seed

我刚刚学会了如何使用机器学习模型随机森林;然而,虽然我阅读了 random_state 参数,但我无法理解它的作用。例如,random_state = 0 random_state = 300 有什么区别 有人可以解释一下吗?

3 个答案:

答案 0 :(得分:0)

train_test_split 将数组或矩阵拆分为随机训练和测试子集。这意味着每次在不指定 random_state 的情况下运行它时,都会得到不同的结果,这是预期的行为。 当您使用 random_state=any_value 时,您的代码将在您运行代码时显示完全相同的行为。

答案 1 :(得分:0)

此外,当我们使用 random_state 时,大多数人使用数字 42。

例如,random_state = 42,这是有原因的。 下面是答案。

数字 42 在道格拉斯·亚当斯 (Douglas Adams) 的《银河系漫游指南》中是“生命、宇宙和一切终极问题的答案”,由名为 Deep Thought 的巨型超级计算机在 750 万个周期内计算得出年。不幸的是,没有人知道问题是什么

答案 2 :(得分:0)

随机森林通过随机采样数据和特征来引入随机性。由于这些随机抽样,对完全相同的数据运行 RF 可能会为每次运行产生不同的结果。将种子固定为常数,即 1 将消除这种随机性,并且每次运行都会产生相同的结果。