云计算简史(完整版)( 七 )
突破的关键点可能在两个方面 , 一是大数据技术栈本身十分复杂 , 当下的工具还依赖专门训练的计算机专家 , 产业还没有抽象出一个通用领域的应用模型 , 也无法提供一个类似SaaS这样友好的应用界面 。 这值得数据技术领域和企业应用领域中的跨界专家来探索 。二是企业数字化建设还刚刚开始 , 很多企业缺失稳定和可靠的数据采集和记录的过程 。 如果没有数据流 , 自然就不会有大数据应用 。 因此大数据技术被广泛应用可能还需要五到十年的时间 。
人工智能(Artificial Intelligence)
人工智能的概念和基本原理起源早至1950年代 。 早期的人工智能研究集中在加州大学伯克利分校 , 麻省理工 , 斯坦福和南加州大学等计算机实验室中 。 今天已经商业化的神经网络算法就来自于半个世纪多前麻省理工大学的明斯基教授发表的《感知元》论文 , 但是计算机算力在当时实在是太弱了 , 以至于任何计算理论上的假设都很难付诸于现实 。 因此 , 在长达五十年的时间内 , 人工智能技术都停留在理论研究和一部分不成功的实践上 。
虽然人工智能领域经历了漫长的冬天 , 但它所提出的机器向人类学习 , 并最终在特定领域能够做得比人类更好的假设却是千真万确的 。
千禧年后的AI复苏
2000年以后 , 有几大动因推动了人工智能概念的复兴 。 首先 , 因为摩尔定律的存在 , 计算机的运算速度和单位存储成本均用指数速率发展到一个新的阶段 。 云计算和大数据技术也允许计算机用很快的速度处理TB甚至PB级的数据 。 其次 , 网络服务的兴起在诸多领域生产出丰富的数据 , Google , Netflix和Amazon的业务就像数据机器一样 , 每分每秒都能产生海量的用户行为数据 。
第三 , 在人工智能的数学方法研究中 , AT&T贝尔实验室的三位科学家(Tin Kam Ho, Corinna Cortes, 和 Vladimir Vapnik)在机器学习领域取得了突出的进展 。 机器学习技术可以将复杂和不确定的非线性问题通过线性的数学公式来解决 。 在解决不同的问题的过程中 , 机器学习理论方法和实践被明确验证 。 最早的一批互联网企业 , 包括Google , Facebook , Linkedin等在这个过程中既提供了海量数据 , 也从研究过程中获得了巨大的成果 。 尤其是Google , 它是机器学习及其分支深度学习领域最重要的信奉者和推动者 。 2010年 , Google成立了Google大脑 , 一个专注人工智能研究的内部组织 , 后来又收购了英国企业DeepMind 。 后者在2016年3月击败了人类围棋冠军李世石 。
下图是Tom Siebel在Digitlal Transofrmation一书中对AI技术进化史的一张插图 , 显示了从1950年代开始到现在的主要技术迭代历史 。
本文插图
机器学习(Machine Learning)
机器学习是推动AI复苏的最重要动力 。 它的兴起标志着人工智能很长时间弯路的终结 。 要想让机器比人做得更好 , 并不是依靠人来教机器规则 , 而是让机器从历史数据中学习 。 比如最常见的机器学习场景——物体识别 , 要想让机器从各种照片中找出“猫” , 只要让机器学习各种各样猫的照片对象 。 机器学习算法会将训练用的猫图像背后的向量特征总结为一个预测模型 , 让这个模型预测任何一张新图片中包含猫的概率 。 同样的道理 , 语音识别、语言翻译、人脸识别等都是使用的类似的原理 。 喂养算法的数据量越大 , 通常预测的准确率就越高 。
机器学习应用可以分为有监督学习和无监督学习 。 前者需要人工参与训练数据的标识 , 后者则通过数学方法自动聚类出存在相似性的对象 。 在缺少训练数据的情况 , 无监督机器学习就会起到更大的作用 。
机器学习的一个分支被称为深度神经网络(DNN) , 它的设计已经高度参照了人类大脑神经元的连接结构 。 在深度神经网络中 , 数据被输送到输入层 , 结果则从输出层产生 , 在输入层到输出层之间存在多个隐藏层 , 每一层会对输入数据的各个特征进行推断 , 最终能够得到更为准确的预测结果 。 打败李世石的AlphaGo就是一个基于深度神经网络的算法 。 但是 , DNN对于用户来说依然是一个黑盒子 。 设计者并不需要也不会知道神经网络中的每一层到底在判断什么具体特征 , 以及它是如何分解特征的 。 它背后都是高度抽象的数学方法 。 不管它有多么玄妙 , 深度神经网络的确厉害 , 它不仅具备高超的自学习能力 , 而且还简化了传统机器学习中大量复杂和耗时的特性工程(Feature Engineering , 通过行业专有知识来调优机器学习算法的过程) 。
推荐阅读
- 互联网|中国互联网大佬直播简史
- Epic|喜加一:EPIC限时免费领取独立恐怖题材冒险游戏《DARQ:完整版》
- 学生|她值得!张桂梅被写进中华人民共和国简史 网友纷纷留言致敬
- 张桂梅被写进《中华人民共和国简史》!网友3字留言刷屏
- 云计算|阿里云发布全新容器服务ACK Anywhere:四大核心能力、统一集群管理
- 华为|华为3亿元成立深圳云计算公司 云业务已成国内第二
- 完整版|25秒!周杰伦公布新歌MV前奏,吊足胃口
- 中青报整版聚焦付费刷课乱象:每门4至6元,“不学而过”
- 云计算|Windows 365云电脑配置公布:最高8核、512GB 随时随地访问
- 华为|手机业务被打压 华为发力云计算:份额国内第二、仅次于阿里
