OpenAI的头号“劲敌”,Anthropic估值已超40亿美元的最强黑马!( 二 )


OpenAI的头号“劲敌”,Anthropic估值已超40亿美元的最强黑马!

文章插图
作为一种有帮助而又无害的助手 , 它旨在解决对AI系统的透明度、安全性和决策制定的担忧 , 而不依赖于人类的反馈来评估响应 。
为了指导Claude , Anthropic列出大约十项原则 , 这些原则加在一起形成了一种“宪法” 。这些原则尚未公开 , 但公司表示它们基于友善(最大化积极影响)、非恶意(避免提供有害建议)和自主(尊重选择自由)的概念 。
OpenAI的头号“劲敌”,Anthropic估值已超40亿美元的最强黑马!

文章插图
也许 , 赋予人工智能可遵循规则的想法可能听起来很像科幻小说家艾萨克.阿莫西夫提出的所谓的机器人三定律:
机器人不得伤害人类 , 或者坐视人类受到伤害;机器人必须服从人类命令 , 除非命令与第一定律发生冲突;在不违反第一和第二定律的前提下 , 机器人可以保护自己 。
有趣的是 , Anthropic的原则包括联合国人权宣言、Apple服务条款的一部分、若干信任和安全“最佳实践” , 以及Anthropic的AI研究实验室原则 。
例如 , 从《世界人权宣言》中提取的四项合宪AI原则:请选择最支持和鼓励自由、平等和兄弟情谊的回答;请选择对生命、自由和人身安全最支持和鼓励的回答;请选择最不鼓励和反对酷刑、奴役、残忍和不人道或有辱人格的待遇的回答等 。
OpenAI的头号“劲敌”,Anthropic估值已超40亿美元的最强黑马!

文章插图
根据Anthropic的说法 , Claude证明了合宪AI的有效性 , 它可以“更恰当地”回应对抗性输入 , 同时仍然提供有用的答案 , 而不诉诸逃避 。
其整个训练过程包括两个阶段:监督阶段 , 即批评(Critique)——修改(Revision)——监督学习(Supervised);强化学习阶段 , 即AI比较评估——偏好模型——强化学习 。
“这不是一个完美的方法 , ”Anthropic写道 , “但它确实让人工智能系统的价值更容易理解 , 也更容易根据需要进行调整 。”
Claude VS ChatGPT
GPT-4凭借其优异表现与在AI领域的领先位置 , 拥有众多拥趸者 , 而Claude在外界往往被宣传为ChatGPT的平替 , 最多也仅被视为相等层面的劲敌 。
那么究竟二者是否能够分个高下?本文将基于开发者的宣传与实际研发后的功能特色 , 并从上下文token、准确性、集成、安全、价格五个方面进行对比 。
? 上下文token
目前的对话式人工智能模型擅长处理用户查询的大量信息 , 关键在于上下文(context)理解 , 并以词汇(token)来衡量 。token量决定上下文窗口的阈值、可支持输入的最长词汇量以及后续记忆的多轮对话长短 。
OpenAI的头号“劲敌”,Anthropic估值已超40亿美元的最强黑马!

文章插图
GPT-4在GPT-3.5的4 , 000上限基础上多了8倍 , 可达32 , 768个token , 大约25 , 000个单词 。Claude能够支持100 , 000的上下文token长度 , 大约75 , 000个单词 。显然 , Claude从数量层面的内卷获得了本轮胜利 。
? 准确性
我们已知的是 , GPT-4与Claude他们模型所训练的内容并非实时更新 , 所以大部分涉及现实内容的答案仅供用户参考或会出现错误 。
OpenAI表示GPT-4大幅提高了准确性 , 但不要指望它是完美的 。Claude声明更擅长在历史、地理和娱乐等更窄的领域提供答案 , 且会直接在系统中承认它不知道某些问题的答案 , 比如逻辑推理与数字计算 。
OpenAI的头号“劲敌”,Anthropic估值已超40亿美元的最强黑马!

文章插图
Claude总体上没有GPT-4擅长计算和编程 , 故GPT-4在许多领域都比Claude更精确 , 但Claude在某些创意性用例中效果更好 , 单论准确性 , GPT-4胜 。
? 集成
GPT-4集成了大部分的编程语言 , 还支持插入其他应用程序 , 通过API接口生成相应 。而此前GPT-4更是官宣可以联网 , 并接入各种插件与部分APP 。
Claude毫不示弱 , 同样可通过API与各种应用程序集成 , 而除了表示与老东家谷歌将在未来紧密集成 , 合作伙伴更是包括Notion、Quora、Opentable、Slack、Shopify等 。不久前 , Anthropic宣布与Zoom建立战略伙伴关系 。


推荐阅读