中国统计网|机器学习路人实验!一份人人都能看懂的入门知识清单

-点击上方“中国统计网”订阅我吧!-
中国统计网|机器学习路人实验!一份人人都能看懂的入门知识清单
文章图片
文末领取【199份麦肯锡咨询项目案例】
在过去的几年里 , 人们对机器学习产生了新的兴趣 。 这种复苏似乎是由强大的基本因素推动的——全球各地的终端都在释放出的大量数据 , 并且这些数据的成本非常低廉 , 计算成本是有史以来是最低的!
然而 , 并非每个人都了解机器学习是什么 。 这里有几个例子:
什么是机器学习?它与大数据和业务分析有何不同?
机器学习 , 数据分析 , 数据挖掘 , 数据科学和AI之间有什么区别?
最近 , 我想到了一个有趣(但非常真实)的主题 。
中国统计网|机器学习路人实验!一份人人都能看懂的入门知识清单
文章图片
说道这一点 , 考虑到这个话题上的混乱程度 , 我写一篇关于机器学习的介绍性文章 。 这个想法是去掉所有可能在过吓唬人的术语 , 创造一些可以被5岁的孩子轻松了解的东西(emmm............好吧 , 可能需要高中毕业)!
机器学习究竟什么是?我做了一个小实验......为了确保我不会高估(或低估)目标受众的能力 , 我找到了10个对分析完全陌生的人 。 他们之前都没有听说过机器学习(是的 , 真的有这样的人!!) 。 他们是这样说的:
我不知道 , 可能是向机器中学习?
让机器学习一些东西 , 也就是编程机器软件
借助计算机帮助我学习?
通过在线课程学习(!!!)
这很有趣!完美的解释了他们认为的机器学习 。 以下是我向这些人解释机器学习的概念:
机器学习是指以最智能的方式处理大量数据(通过开发算法)以获得可操作的见解的技术 。
这时 , 他们看着我 , 就好像我是火星人一样对他们说话!所以 , 我停止了愚蠢的术语讲解 , 然后反过来问他们问题 , 方便他们可以更深入的了解:
KJ:当你在谷歌搜索某些东西时 , 你认为会发生什么?
组员:Google会显示与该搜索相关的网页 。
KJ:那很好!但究竟是什么让Google可以向你显示这些相关页面呢?
这次看起来他们想的比较多 。 然后组内的一些人开始发言:
组员:Google会查看用户过去的点击次数 , 了解哪些网页与这些搜索更相关 , 然后在搜索结果上提供这些结果 。
这是一个很好的尝试 。 但我还必须控制住自己的冲动 , 告诉他们Google做到这一点要比他们这个简单的概念复杂的多 。 但是 , 我想我有一个更好的方法来解释机器学习 。 所以 , 我继续说:
KJ:好的 , 这听起来不错 。 但是 , Google会定期处理多少次搜索以及所有搜索的类型?
组员:这一定是一个很大的数字-可能每年是一万亿次搜索
KJ:那么 , 你们认为Google如何准确地满足如此多的请求?你们是不是认为有人坐在Google办公室并不断处理哪些搜索结果是跟搜索的问题是相关的呢?
小组成员:我还没有想过 , 但是不会有人去处理这些 , 因为这好像听起来不像是人类可以处理的 。
KJ:你是对的 。 这是机器学习发挥作用的地方 。 机器学习是一组技术 , 以最智能的方式处理大量数据(通过开发算法或一组逻辑规则) , 来获得可操作的结果(在我们讨论的问题中是为用户提供搜索) 。
这时小组成员们按照意料之中的点了点头 , 看起来像我已经完成任务......可是总觉得哪里不对呢…
现在有一些常见的问题——比如机器学习与X有什么不同?
你开始学习有关机器学习的那一刻 , 你会看到各种知识好像火箭一样在高速的轰炸着你 。 这些是术语在行业内使用的比较多 。 以下是其中一些:人工智能 , 深度学习 , 数据挖掘和统计 。
为了让你更加清楚理解 , 我以简单的方式解释了这些术语 。 你还会了解到这些术语在机器学习中的重要性:


推荐阅读