AI人工智能|AI应用大爆发时代 “深藏功与名”的华为ML kit

AI人工智能|AI应用大爆发时代 “深藏功与名”的华为ML kit
文章图片

文章图片

AI是未来 , 人工智能正在成为像水、电、网络一样的必需品 。
科幻电影《头号玩家》中的“虚拟数字人”黑科技正在走进人类现实生活 。
在近日举行的华为开发者大会2020智慧业务分论坛上 , 上海日报社对外展示了其最新的虚拟主播 , 在新闻播报中可以同真人一样主持播音 。
AI人工智能|AI应用大爆发时代 “深藏功与名”的华为ML kit
文章图片

文章图片

图源:上海日报
该虚拟主播支持自定义主播风格 , 大幅缩短视频新闻内容的制作周期 , 自动化快速生成视频播报新闻 , 完全不需要人工干预 , 实现7*24小时在线服务 。
虚拟主播背后的“关键先生”
相信你一定十分好奇 , 作为一家新闻传播机构 , 上海日报社的技术开发人员是如何开发出足以让人们眼前一亮的AI黑科技应用的呢?
实际上 , 隐藏在虚拟主播背后的“关键先生”是华为全新推出的综合多模态AI能力 , 即华为HMS ML Kit数字人(以下简称“ML Kit数字人”)功能 。
AI人工智能|AI应用大爆发时代 “深藏功与名”的华为ML kit
文章图片

文章图片

据介绍 , 该虚拟主播正是上海日报社基于这一最新功能定制开发完成 , 大大降低了开发难度、制作成本 , 同时也缩短了制作周期 。
利用华为公司强大的图像处理、语音合成、声音克隆、语义理解等多种AI核心技术 , 使得其在语音合成、关键面部表情动作还原和图像渲染上 , 都做到了行业顶尖水平 。
比如在最关键的图像渲染上 , 相比目前业内最好的2K水平 , ML Kit数字人已经可以做到支持超高清4K影院级效果 , 且支持多分辨率调节 。
从合成效果来看 , 能够达到唇部的牙齿细节、光照和纹理足够清晰 。同时声音足够真实、音色同步、自然流畅 。
此外 , 在背景替换方面 , ML Kit数字人可做到实时背景分割 , 甚至精确到发丝级分割 , 且全流程自动化生成 , 实时快速生成视频效果 。
从应用前景来看 , ML Kit数字人主要面向教育、新闻、多媒体制作企业 , 提供高质量、低成本、创新体验的内容创作模式 。
目前 , ML Kit数字人提供多种预置形象 , 支持中英文本地口音播报 , 适用不同场景内容生产 , 无需二次审核校验 , 生成内容质量稳定 。
AI应用开发落地 , 华为ML kit生根
实际上 , 数字人仅是华为机器学习服务(以下简称华为ML kit)众多AI应用功能中的一种 。
华为ML kit还提供丰富的文本类、语音语言类、图像类和人脸人体类等简单易用、技术领先的AI服务 。
在具体的技术优势上 , 华为ML Kit的识别能力、识别速率和识别精度上都已赶超行业标杆水平 。
如在华为ML Kit人脸检测能支持多人脸轮廓识别、丰富的人脸表情识别 , 包括喜、怒、哀、乐、惊、恐、悲 , 人脸轮廓能支持845个关键点的高精度检测 。
华为ML Kit支持在设备端和云端运行 , 设备端速度快 , 没有网络连接也能正常运行 。
在云端的话 , 可以依托强大计算能力 , 识别精度更高 , 适用更复杂的应用场景 。
华为ML Kit的优势还体现在支持终端的丰富性上 , 随着未来IoT终端迎来爆发和5G时代的到来 , 这方面的优势会愈发显现 。
开发者可以将华为ML Kit快速引入应用 , 大幅提升用户体验及满意度 。
以华为ML Kit提供的翻译服务为例 , 就高效便捷地解决了很多出海企业的翻译刚需 。
华为ML Kit文本翻译能力 , 在云侧可支持20种语种互译和52种语种的检测能力 , 在端侧支持12种语种互译和50种语种的检测 。大部分语种达到业界最佳水平 。


推荐阅读