生态|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨( 二 )


如今 , 飞桨已经应用到金融、工业、城市治理等多个领域 。
在金融风控领域 , 使用飞桨可以将信贷风险判断准确率提升 21% , 飞桨中的语义理解模型 ERNIE 通过学习大量的文本和知识实现了语义理解性能的大幅提升 。
在计算机视觉领域 , 飞桨已经开始助力工业质检 , 比如笔记本外壳检测、总装车灯检测 , 帮助工厂在大面积的产品或小部件中找出微小的瑕疵 。
在智慧城市中 , 飞桨可以应用于城市治理、施工车辆追踪 , 车辆违章监测等场景 。
飞桨的成功秘诀:开源
和 AI 领域的其他技术一样 , 飞桨的成功 , 自然也离不开开源 。
作为开源软件 , 飞桨一直在建设开源社区 。 目前 , 飞桨已经凝聚了 230 万开发者 , 创造了 31 万个模型 , 项目数量总体超过 4.7 万 , 并且有多个项目登顶各大榜单 。 飞桨推出的飞桨开发者 PPDE 计划也共建了开源社区 , 组建了 22 个飞桨地方社群 , 100 多个高校社群 。
开源给飞桨的开发所带来的益处良多 。
首先 , 开源的环境对平台的开发提出了更高的要求 。 开源以后 , 社区里的开发者非常多 , 工程师把代码亮出来以后 , 大家都能知道你是如何设计的 , 以及你的代码、文档有没有问题 。 这就对整个编程的易用性、API 的完备性提出了新的要求 , 这些要求以前在不做开源时不会考虑太多 。
其次 , 开源是帮助构建生态的良好方式 。 深度学习框架的上下游生态非常复杂 , 需要和芯片、计算机系统做对接 。 在飞桨开源的生态系统中 , 第三方生态贡献扮演了很重要的角色 。 在飞桨这个项目中 , 很多的开发不是百度工程师做的 , 还有其他人在基于这个做出新的项目和更多的贡献 。
在论坛中 , 王海峰表示 , 百度十年以前开始全面布局人工智能的时候 , 就是本着开源、开放的精神 。 早在 2012 年 , 百度就开放了翻译的 API 。 如今 , 百度翻译每天的翻译量已经达到了 1000 亿字符 。 2013 年 , 百度又开放了语音平台 , 现在每天的调用量超过 150 亿 。
2016 年 , 在开源飞桨的同时 , 百度也开放了百度大脑的很多 AI 能力 。 发展到今天 , 百度大脑每天的调用量超过 1 万亿 , 很多开发者都在使用这些工具推动自己的业务 。
与此同时 , 企业对于开源的拥抱程度也是在持续增加的 。
一方面 , 企业自身所开发的软件平台、工具正在进行越来越多的开源工作 , 有 95% 的受访者认为企业开源是至关重要的 。 另一方面 , 企业在使用开源软件的时候 , 预期也在一直在发生变化 , 77% 的受访者表示他们希望增加对企业开源软件的使用 。 这些都说明 , 开源社区是在持续发展的 , 这反过来又会促进飞桨等开源平台的发展 。
核心问题:如何建好生态?
在主题演讲之后 , 百度深度学习技术平台部高级总监马艳军主持了一场围绕「AI 开源创新赋能产业发展」话题的高峰对话 。 工商银行大数据人工智能实验室副总经理黄炳、中国联通研究院人工智能总监廖军、中车研究院智能产品负责人田寅、Gartner(高德纳)研究咨询高级总监张桐、百度 AI 技术生态部总经理刘倩等嘉宾展开深度的行业交流 。
田寅表示 , 开源工具在传统企业发挥着非常重要的作用 , 它们可以帮大家更快地上手深度学习 , 更快地领悟到新技术 。 廖军认为 , 这种好处其实是双向的 , 在开源工具赋能传统行业的同时 , 后者其实也充当着贡献者 , 在用的过程中发现问题 , 帮助开发者打磨这些工具 , 双方一起建设一个完善的生态 。
在整个论坛中 , 「生态」都是一个高频词 , 开源本身就是要建立一个生态体系 。 那么 , 如何建好这个生态体系 , 找到利益互通的点 , 避免恶性的竞争是一个值得思考的问题 。
张桐认为 , 在数据方面 , 我们需要用联邦学习等技术解决数据孤岛问题 , 让数据真正为我所用;在算力方面 , 要建立一种共享机制 , 帮助中小企业用上 AI 。
对于数据孤岛问题 , 黄炳补充说 , 其实行业里面关于联邦学习的产品不是没有 , 而是过多 。 因此眼下的问题其实是联邦学习缺乏规范性 。 他认为 , 要让中小企业用上 AI , 核心其实是搭建平台 , 把中小企业接触 AI 的门槛降下来 。
众嘉宾表示 , 目前业界开源生态与环境正在随着 AI 大规模落地的进展快速构建 。 在业务实践中 , 类似飞桨这样成熟可靠 , 已被大量产业级应用验证的开源平台 , 不仅为技术开发和企业创新不断降低着门槛 , 更为整个产业智能化升级不断加速 。
生态|谈起国内AI开源开放生态,为何这些大咖都在讨论飞桨
文章图片

「AI 开源创新赋能产业发展」 高峰对话 。
对于百度做开源的核心思路 , 百度 AI 技术生态部总经理刘倩解释说:「做开源开放的时候 , 我们有一个非常明确的判断 , 就是人工智能最后的产业级应用一定不是由某一家企业来主导完成的 , 最后一定会形成一个角色分明、上下游的这样一个产业级的生态 。 所以从那个时候开始 , 我们去分享开源平台 , 去做百度大脑开放平台 , 其实都是在做最底层的基础设施 , 希望能够给各行各业提供从数据、算法、工具到平台的支持 。 」


推荐阅读