|GPT-3横空出世,开创人机交互全新时代


人工智能在过去十年取得了巨大的进步 , 但我们从未见过人工智能研究人员像现在这样兴奋——一种名为GPT-3的新系统的问世改变了人工智能的格局 。 那么GPT-3是什么 , 它将带来什么影响呢?
【|GPT-3横空出世,开创人机交互全新时代】|GPT-3横空出世,开创人机交互全新时代
本文插图

GPT-3的今生前世
GPT是生成前训练(Generative Pre-training Transformer)的简称 , 是一种语言模型 , 2018年由埃隆·马斯克的人工智能研究实验室OpenAI发布 。 它采用了生成式语言模型 , 通过对不同的书面材料集与长篇连载文本的预训练 , 能够获取世界知识并自主处理文本 。 这意味着 , 你向它输入一些文本 , 它可以自主以文本响应 。 经过数次测试 , 研究人员表明 , 由它生成的新闻文章通常很难判断是机器人编写的 。
GPT-3的前身GPT于2018年发布 , 包含1.17亿个参数 。 2019年发布的GPT-2包含15亿个参数 。 相比之下 , GPT-3是AI世界最新、最强大的工具 , 它在一系列任务中都达到了最先进的水平 。 它的主要突破是不再需要针对特定任务进行微调编码(它会自主调整) 。 在规模方面 , 这个模型再次大幅扩展 , 达到了1750亿个参数 , 是其前身的116倍 。 虽然GPT-3完全不需要人为训练 , 但经过一次或几次学习后 , 原本就已出类拔萃的性能还会更加登峰造极 。
|GPT-3横空出世,开创人机交互全新时代
本文插图

GPT-3的训练数据集也十分庞大 。 整个英语维基百科(约600万个词条)仅占其训练数据的0.6% 。 训练数据的其他部分来自数字化书籍和各种网页链接 。 不仅包括新闻文章、食谱和诗歌之类的内容 , 还包括程序代码、科幻小说、宗教预言等各种你可以想象到的任何文字 。 上传到互联网的文本类型都可能成为其训练数据 , 其中还包括不良内容 , 比如伪科学、阴谋论、种族主义等等 , 这些内容也会投喂给GPT-3 。
这种深度和复杂性使输出也具有复杂性 。 GPT-3目前以开放测试版的形式提供 , 预计最终会推出付费的私人测试版 。 OpenAI表示 , 对于明显有害的使用途径 , 如垃圾邮件、假新闻等 , 他们将终止API访问 。 但最明显受到威胁的人群主要是原创作者 。
|GPT-3横空出世,开创人机交互全新时代
本文插图

专家对GPT-3褒贬不一
一位匿名的在Google资深AI研究人员表示 , 他们认为GPT-3仅能自动完成一些琐碎任务 , 这些任务较小、更便宜的AI程序也可以做到 , 而且GPT-3程序的“绝对不可靠性”最终会破坏其商用 。 这位研究人员指出 , 如果没有更多复杂的工程调试 , GPT-3并不能直接使用 。
AI研究人员朱利安(Julian Togelius)说:“ GPT-3的表现常常像是一个聪明的学生 , 没有读完书 , 试图通过废话 , 比如一些众所周知的事实和一些直率的谎言交织在一起 , 让它看起来像是一种流畅的叙述 。 ”
|GPT-3横空出世,开创人机交互全新时代
本文插图

另一个严重的问题是GPT-3的输出存在偏见 。 英伟达的AI专家安纳库玛(Anima Anandkumar)教授指出 , GPT-3在部分程度上接受了很多歧视性语言 , 并且根据此数据构建的模型产生的文本有“令人震惊的偏向性” 。
人工智能越来越聪明不一定是好消息
在过去的几年里 , “狭义人工智”能取得了非凡的进步 。 人工智能系统在翻译、国际象棋和围棋等游戏、重要的生物学研究问题(如预测蛋白质折叠和生成图像)方面都有了显著的改进 。
|GPT-3横空出世,开创人机交互全新时代


推荐阅读