提升10%!如何将机器学习模型准确率从80%提高到90%以上( 二 )
流行的集成学习算法包括随机森林、XGBoost、梯度提升和AdaBoost 。 为了解释为什么集成学习算法如此强大 , 我举一个随机森林的例子:随机森林包括使用原始数据的引导数据集创建多个决策树 。 然后 , 模型选择每个决策树的所有预测的模式(大多数) 。 这有什么意义?
通过依赖多数人获胜的模型 , 它减少了单个树出错的风险 。
本文插图
例如 , 如果创建了一棵决策树 , 第三个的预测结果是0 。 但如果我们依赖于所有4棵决策树的模式 , 预测值将是1 。 这就是集成学习的力量 。
5. 调整超参数
最后 , 调整模型的超参数是一件不常提及但仍然非常重要的事情 。 你必须清楚地理解正在使用的机器学习模型 , 否则就很难理解每个超参数是什么 。 看看随机森林的所有超参数:
class sklearn.ensemble.RandomForestClassifier(n_estimators=100,*, criterion='gini', max_depth=None,min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features='auto', max_leaf_nodes=None,min_impurity_decrease=0.0, min_impurity_split=None, bootstrap=True,oob_score=False, n_jobs=None, random_state=None, verbose=0,warm_start=False, class_weight=None, ccp_alpha=0.0,max_samples=None
例如 , 了解什么是min_impurity_decrease可能是个好主意 , 这样当你想要机器学习模型更宽容 , 就可以调整这个参数 。
这些将还将使未来的数据科学项目进行得更加顺利 , 项目精确度大幅提高 。
本文插图
留言点赞关注
我们一起分享AI学习与发展的干货
【提升10%!如何将机器学习模型准确率从80%提高到90%以上】如转载 , 请后台留言 , 遵守转载规范
推荐阅读
- 收盘下跌|10月20日美三大股指集体收跌,道指跌超400点,纳指跌1.65%
- 京东图书与文轩在线携手,会颠覆图书电商的格局吗?
- 下个10年,Go能取代Python成为开发者的首选语言吗?
- 徐峥|徐峥年初被23家电影公司联名“封杀”,上万人签名抵制,现状如何
- 精灵宝可梦|《宝可梦:剑盾》极巨大冒险传说宝可梦可以100%收服
- 项羽|王者荣耀: 突然成就T0边路, 双重真伤无克星, 出反甲伤害提升40%
- 游戏葡萄|七年磨一剑的任天堂,如何用美术诠释游戏?
- 天秤座每日运势|天秤座每日运势2020年10月20日2020/10/20 #天秤座# 每日运势
- 智能城市崛起,看智能化如何定义未来之城
- 萍姐姐调侃体育|郭艾伦如何回应?国产第一后卫之争愈演愈烈,吴前爆发孙铭徽开挂
