澎湃新闻|GPT3是暴力美学巅峰?智源研究院欲开发通用智能图灵测试

:原题为_澎湃新闻|GPT3是暴力美学巅峰?智源研究院欲开发通用智能图灵测试。
“GPT-3可以称之为暴力美学的巅峰……英文维基百科的全部内容仅占其训练数据集的0.6%……是一个极其烧钱、极其庞大、极其有算力的系统 。 ”
8月24日 , 北京智源人工智能研究院在北京举行“人工智能的认知神经基础”重大研究方向发布会 。 清华大学心理学系教授刘嘉出任该重大研究方向的首席科学家 , 他在当天的演讲中分析人工智能研究机构Open AI近期发布的生成式语言模型GPT-3 。
刘嘉提到 , GPT-3通过对大量书面材料集与长篇连载文本的预训练 , 获取关于世界的知识 , 将“暴力美学”发挥到极致 , 然而却无法做到理解、共情、推理等对于人类极为容易的事情 。 他认为 , 这种暴力美学无法实现真正的智能 , 通用智能还需看生物智能 。
澎湃新闻|GPT3是暴力美学巅峰?智源研究院欲开发通用智能图灵测试
文章图片
清华大学心理学系教授刘嘉
刘嘉教授毕业于麻省理工学院脑与认知科学系 , 获认知神经科学哲学博士学位 。 现为清华大学基础科学讲席教授 , 在清华大学心理学系和脑与智能实验室从事教学和科研工作 。
北京智源人工智能研究院成立于2018年11月 , 是在科技部和北京市政府指导和支持下 , 由北京市科学技术委员会和海淀区政府推动成立的新型研究机构 。
暴力美学无法实现真正的智能GPT-3全称Generative Pre-training Transformer-3 , 即生成式语言模型 , 通过对不同的书面材料集与长篇连载文本的预训练 , 以获取关于世界的知识 。 GPT-3具有 1750 亿参数 , 远超此前类似语言模型 , 参数量较2019年2月发布的GPT-2高两个数量级(GPT-2含15亿参数) 。
自Open AI 2020年6月发布该模型起 , GPT-3因其强大功能和令人惊叹的测试结果备受关注 。 它可以实现的功能包括:输入一句自然语言后 , 模型自动完成编程;对模型描述一种病症 , 它可以指出是什么疾病并开出药方;甚至询问一些关于人生信仰的问题 , 模型也可以做出回答 。
以上这些强大的功能主要建立在庞大的数据量和巨额投资之上 。 据刘嘉介绍 , GPT-3一次训练的费用是460万美元 , 训练时间为355个GPU年 , 即如果以1个GPU衡量 , 需耗时355年 。 而包含约600万篇文章的英文维基百科的全部内容仅占其训练数据集的0.6% 。
尽管投入巨大 , 但不少计算机科学家认为GPT-3不具有革命性的变化 , 不能真正理解语义 。
刘嘉谈到 , GPT-3模型所做的仅仅是把一些知识链接在一起 , 但没有理解其含义 。 例如 , 当被问到“我的脚有多少只眼睛”时 , 模型会回答“你的脚有两只眼睛” 。
刘嘉评价称 , GPT-3 “之所以做出这类不恰当的回答 , 不是因为训练数据不够 , 而是没有理解‘眼睛’的概念 , 也没有相关的常识” 。
澎湃新闻|GPT3是暴力美学巅峰?智源研究院欲开发通用智能图灵测试
文章图片
除了理解能力不足 , 共情、推理等能力也是目前的人工智能模型难以做到的 。 “我们没有去教会机器怎么理解、怎么推理 , 怎么寻找内在关系 , 找到万事万物背后运行的规则 。 ”
通用智能或需看生物智能刘嘉介绍 , 智源研究院此次发布的“认知神经基础”重大研究方向希望能够探索生物智能 , 将生物智能与人工智能进行融合 。 他表示 , 整个“认知神经基础”课题团队 , 将致力于将神经科学、认知科学和计算科学进行交叉融合 , 从三个方向向通用人工智能靠近 。
澎湃新闻|GPT3是暴力美学巅峰?智源研究院欲开发通用智能图灵测试
文章图片
【澎湃新闻|GPT3是暴力美学巅峰?智源研究院欲开发通用智能图灵测试】刘嘉表示 , 从认知神经的角度考虑 , 理解智能有三个层级 , 硬件层面、表示与算法层面以及计算理论层面;对应到生物智能中 , 分别是脑神经结构、生物神经网络模型以及认知模型 。


推荐阅读