随机森林算法是如何在内部工作的( 二 )

2026-02-10 随机森林算法

随机森林算法是如何在内部工作的

文章插图

现在你有一个由随机创建的迷你树组成的森林（因此得名Random Forest）
第7步-推理现在让我们预测一个看不见的数据集（测试数据集）中的值
为了推断（通常称为预测/评分）测试数据，该算法将记录传递到每个迷你树中。

随机森林算法是如何在内部工作的

文章插图

记录中的值根据每个节点表示的变量遍历迷你树，最终到达一个叶节点。基于该记录结束的叶节点的值（在训练期间决定的），该迷你树被分配一个预测输出。

随机森林算法是如何在内部工作的

文章插图

类似地，相同的记录经过所有的100个小决策树，并且每100个树都有一个预测输出。这个记录的最终预测值是通过对这100棵小树的简单投票来计算的。

随机森林算法是如何在内部工作的

文章插图

现在我们有了对单个记录的预测。
该算法按照相同的过程迭代测试集的所有记录，并计算总体精度！

随机森林算法是如何在内部工作的

文章插图

迭代获得测试集每一行的预测的过程，以达到最终的精度。
参考文献[1] sklearn’s documentation for RandomForestClassifier ( version : 3.2.4.3.1)
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html

推荐阅读

上一篇：豪华茉莉茶蛋的做法,抹茶脆曲奇的做法

下一篇：老班章茶是什么茶,你的老班章够正宗吗