我刚刚学会了如何使用机器学习模型随机森林;然而,虽然我阅读了 random_state 参数,但我无法理解它的作用。例如,random_state = 0
和 random_state = 300
有什么区别
有人可以解释一下吗?
答案 0 :(得分:0)
train_test_split
将数组或矩阵拆分为随机训练和测试子集。这意味着每次在不指定 random_state 的情况下运行它时,都会得到不同的结果,这是预期的行为。
当您使用 random_state=any_value
时,您的代码将在您运行代码时显示完全相同的行为。
答案 1 :(得分:0)
此外,当我们使用 random_state 时,大多数人使用数字 42。
例如,random_state = 42,这是有原因的。 下面是答案。
数字 42 在道格拉斯·亚当斯 (Douglas Adams) 的《银河系漫游指南》中是“生命、宇宙和一切终极问题的答案”,由名为 Deep Thought 的巨型超级计算机在 750 万个周期内计算得出年。不幸的是,没有人知道问题是什么
答案 2 :(得分:0)
随机森林通过随机采样数据和特征来引入随机性。由于这些随机抽样,对完全相同的数据运行 RF 可能会为每次运行产生不同的结果。将种子固定为常数,即 1 将消除这种随机性,并且每次运行都会产生相同的结果。