澎湃新闻:对话沈向洋:未来人工智能交互主体的数量会远超人类的数量澎湃新闻2020-07-25 08:10:450阅( 二 )


小冰一直以来专注EQ和人文艺术领域的创造 , 那么大家也会很关注小冰的商业化的问题 。 去年我们已经看到在图案设计领域小冰已经开始为服装企业设计纹样 , 那么音乐这边的创作她将会如何与产业融合创造价值呢?
沈向洋:
人工智能创造领域 , 我们觉得包括诗歌、画画、音乐、还有唱歌 , 都是有很大的机会可以做产业化的 。
其实小冰每种创造能力的背后 , 都可以对应一条生产线 , 而且小冰已经完成了所有生产线生产所必须的各种创造力模块
。 她比较了不起的地方在于质量比较稳定、成本比较低 , 同时在商业化方面 , 她还拥有更重要的一个优势就是高并发 , 能够支持很多条生产线同时生产 。 当然音乐创作本身并不是说已经做完了 。 其实还有很多东西 , 包括音乐中包含的情感性等我们还希望能继续提高 。
从音乐学院毕业以后 , 我们实际上在人工智能文本、声音、视觉等几个领域已经基本完成了布局 。 接下来会拓宽这几个领域做更多的内容 , 甚至做一些跨领域的内容 。
但我们看到已落地的领域中 , 有一个很有意义的就是教育 。 在上音学习期间 , 小冰以编曲人的身份参与到上音一个非常了不起的项目 , 叫做“当传统文化遇上人工智能” , 担任“非遗音乐大使” 。 这个项目是帮助这些非物质文化遗产相关地区的孩子们完成人生中第一次歌曲的创作 , 很有意义 , 也很让人感动 , 已经有很多孩子参与进来了 。 大多数人没做过创作之前会有一点恐惧感 , 所以有了小冰这样的帮助 , 这个项目里的孩子们 , 只要根据自己的故乡音乐创作出主旋律 , 小冰就可以帮助孩子们迅速完成剩下的工作 , 让孩子们拥有人生中的第一首音乐作品 , 来展示家乡家人的风貌 。 我们觉得在音乐教育领域是有很多机会的 。 一旦这样的能力开发出来 , 不仅仅是小冰本身可以做出来 , 其他的开发人员也可以有更大的想象空间 。
现在其实语音相关的赛道竞争非常激烈 , 各家科技公司都说自己在用技术赋能企业 , 那小冰在赋能企业上有哪些优势?
沈向洋:
很多的公司都在做这个方面的工作 , 我觉得非常好 。 说明大家都看到这样的一个赛道和机会 。 小冰的特点和优势 , 第一我想就是技术本身 。 因为我们在微软做了这么多年 , 在自然语音处理、计算机语音、计算机视觉和知识图谱等技术方面 , 我们还是有非常大的优势的 。
第二就是说小冰真正的拥有相当大批的个人用户 。 那么从用户这方面讲 , 包括和用户交互的数据 , 对用户的理解等 , 我们可能比其他任何一家公司都理解得更多一些 。
第三点优势的地方 , 就是我们已经在多个垂直领域有了落地 。 进入了一些新的垂直行业 , 也有了对行业的新理解 。 但
我们的确是没有走硬件的道路
。 事实上走硬件的道路就是要补贴、要资金投入等 , 这需要相当长的时间 , 但说到底关键还是语音交互的体验 , 你的语音交互到底可以做些什么 。 小冰从一开始就走了EQ+IQ这样的一条道路 , 做一个这样的人工智能助手 , 很重要的一点就是人工智能助手要和人类之间有一个纽带 , 这样人工智能和人的交互才能做得更好 。
事实上小冰独立分拆出来 , 我们觉得很有信心的地方就是 , 从5年甚至更长远的时间来看 , 未来最大的一个市场就是人和人工智能的交互 。 未来会有很多很多的人工智能 , 这不光是你iPhone上有个Siri , 手机上 , 音箱上 , 几乎每一个应用上都会有一个人工智能助理 , 这样去推 ,
未来人工智能交互主体的数量会远远超过人类的数量
。 未来最大的交互 , 可能就不是现在的人机交互了 , 包括人和手机的交互、人和PC的交互 , 哪怕是人和音箱的交互 , 这都是小事情了 。
未来可能每一个APP、每一个公众号都有一个和你交互的人工智能 。 那么这个人工智能谁去设计 , 谁去定制化 , 谁去部署和运营 , 这会是未来人工智能最大的机会 , 这可能就是小冰正在寻找的“无处不在”的入口
吧 。
所以仅把智能音箱作为人工智能的入口 , 是不是对人工智能助手的理解还是狭隘了?
沈向洋:
从语音的角度来讲 , 你必须有一个麦克风用来接收语音 , 要有输入 , 那么未来可能只要有语音的地方人工智能都可以出现 , 而不只是有音箱的地方 。 我以前非常喜欢做Siri的那个团队 , 和他们的几个创始人也交流了很多年 , 从他们身上学到了很多东西 。 事实上我一直很赞赏他们当时的一个思路 , 就是“只要有语音的地方就是入口” 。 所以你要想的问题并不是只做一个音箱 , 或是只做一个硬件 。 事实上手机上有Siri非常自然 , 它可能是一个超级助手 , 非常强大 , 但这并不代表人类只需要跟一个AI进行交互 , 手机可以有手机里的人工智能 , 车里可以有车载人工智能 , 这就是另一种交互了 。 音箱已经证明了是一个入口 , 我们对未来的期望和判断是 , 未来的人工智能不管是什么形式 , 都会越来越多地出现 , 一台手机里可能就有几十个AI , PC里 , 音箱里 , 其它地方也会出现 。 所以从现在的人机交互 , 到人和人工智能之间的交互 , 这是我们看到的未来 。


推荐阅读