提升10%!如何将机器学习模型准确率从80%提高到90%以上( 二 )


流行的集成学习算法包括随机森林、XGBoost、梯度提升和AdaBoost 。 为了解释为什么集成学习算法如此强大 , 我举一个随机森林的例子:随机森林包括使用原始数据的引导数据集创建多个决策树 。 然后 , 模型选择每个决策树的所有预测的模式(大多数) 。 这有什么意义?
通过依赖多数人获胜的模型 , 它减少了单个树出错的风险 。
提升10%!如何将机器学习模型准确率从80%提高到90%以上
本文插图
例如 , 如果创建了一棵决策树 , 第三个的预测结果是0 。 但如果我们依赖于所有4棵决策树的模式 , 预测值将是1 。 这就是集成学习的力量 。
5. 调整超参数
最后 , 调整模型的超参数是一件不常提及但仍然非常重要的事情 。 你必须清楚地理解正在使用的机器学习模型 , 否则就很难理解每个超参数是什么 。 看看随机森林的所有超参数:
class sklearn.ensemble.RandomForestClassifier(n_estimators=100,*, criterion='gini', max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None,min_impurity_decrease=0.0, min_impurity_split=None, bootstrap=True,oob_score=False, n_jobs=None, random_state=None, verbose=0,warm_start=False, class_weight=None, ccp_alpha=0.0,max_samples=None
例如 , 了解什么是min_impurity_decrease可能是个好主意 , 这样当你想要机器学习模型更宽容 , 就可以调整这个参数 。
这些将还将使未来的数据科学项目进行得更加顺利 , 项目精确度大幅提高 。
提升10%!如何将机器学习模型准确率从80%提高到90%以上
本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
【提升10%!如何将机器学习模型准确率从80%提高到90%以上】如转载 , 请后台留言 , 遵守转载规范


推荐阅读