机器学习概念和经典算法,我用大白话给你讲清楚了!入门必看( 二 )


概念区分经常会有人把机器学习和人工智能、神经网络等词混淆在一起,他们之间还有有很大区别的 。简单给大家科普一下:

机器学习概念和经典算法,我用大白话给你讲清楚了!入门必看

文章插图
 
  • “人工智能”是整个学科的名称,类似于“生物学”或“化学” 。
  • “机器学习”是“人工智能”的重要组成部分,但不是唯一的部分 。
  • “神经网络”是机器学习的一种分支方法,这种方法很受欢迎,不过机器学习大家庭下还有其他分支 。
  • “深度学习”是关于构建、训练和使用神经网络的一种现代方法 。本质上来讲,它是一种新的架构 。在当前实践中,没人会将深度学习和“普通网络”区分开来,使用它们时需要调用的库也相同 。
经典机器学习算法一半的互联网公司都在研究这些算法,很多大型科技公司非常追捧神经网络,原因显而易见,对于这些大型企业而言,2%的准确率提升意味着增加20亿的收入 。但是公司业务体量小时,就没那么重要了 。我听说有团队花了1年时间来为他们的电商网站开发新的推荐算法,事后才发现网站上99%的流量都来自搜索引擎——他们搞出来的算法毫无用处,毕竟大部分用户甚至都不会打开主页 。
尽管经典算法被广泛使用,其实原理很简单,你可以很容易地解释给一个蹒跚学步的孩子听 。它们就像是基本的算术——我们每天都在用,甚至连想都不想 。下面给大家讲一些经典的机器学习算法:
1.1 有监督学习经典机器学习通常分为两类:有监督学习和无监督学习 。
在“有监督学习”中,有一个“监督者”或者“老师”提供给机器所有的答案来辅助学习,比如图片中是猫还是狗 。“老师”已经完成数据集的划分——标注“猫”或“狗”,机器就使用这些示例数据来学习,逐个学习区分猫或狗 。
无监督学习就意味着机器在一堆动物图片中独自完成区分谁是谁的任务 。数据没有事先标注,也没有“老师”,机器要自行找出所有可能的模式 。后文再讨论这些 。
很明显,有“老师”在场时,机器学的更快,因此现实生活中有监督学习更常用到 。有监督学习分为两类:
  • 分类(classification),预测一个对象所属的类别;
  • 回归(regression),预测数轴上的一个特定点;
分类(Classification)


推荐阅读