
文章插图
现在你有一个由随机创建的迷你树组成的森林(因此得名Random Forest)
第7步-推理现在让我们预测一个看不见的数据集(测试数据集)中的值
为了推断(通常称为预测/评分)测试数据,该算法将记录传递到每个迷你树中 。

文章插图
记录中的值根据每个节点表示的变量遍历迷你树,最终到达一个叶节点 。基于该记录结束的叶节点的值(在训练期间决定的),该迷你树被分配一个预测输出 。

文章插图
类似地,相同的记录经过所有的100个小决策树,并且每100个树都有一个预测输出 。这个记录的最终预测值是通过对这100棵小树的简单投票来计算的 。

文章插图
现在我们有了对单个记录的预测 。
该算法按照相同的过程迭代测试集的所有记录,并计算总体精度!

文章插图
迭代获得测试集每一行的预测的过程,以达到最终的精度 。
参考文献[1] sklearn’s documentation for RandomForestClassifier ( version : 3.2.4.3.1)
https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html
推荐阅读
- 文件增量同步之rsync算法
- 含代码实现 最全解密微信红包随机算法
- AMD|AMD的新算法 竟是老旧N卡的救星
- 红茶是绿茶做的吗,绿茶白森林慕司的做法
- 打散算法的三种解决方案及其选型场景
- 从算力、数据、算法、工程化等维度看AI的未来
- 概率论和统计学中重要的分布函数
- 详解匈牙利算法与二分图匹配
- 挪威森林猫如何选购
- 鸡兔同笼子问题看算法在编程中的重要性,终于明白为何工资低了
