动画|4K修复经典动画 火山引擎的"醉翁之意"在哪?( 二 )


火山方案采用算法+人工两道工序 。算法能够对 95% 的瑕疵进行修改 , 对艺术效果或者视频内容的困难部分 , 则通过人工来进行判断 。
动画|4K修复经典动画 火山引擎的"醉翁之意"在哪?
文章图片
分辨率升到 4K 之后 , 原有的画质一定会信息量不够 。比如细节不足 , 帧数偏少而不够流畅 , 暗景画面模糊 。
火山引擎的「智能超分」和「智能插帧」功能在提升画面质感上可以发挥所长 。
人工修复中 , 如果遇到油污、划痕、变形等问题 , 修复师可能一天只能修 24 帧 , 也就是一秒 。
如果是夜戏、烟雾戏等模糊的画面 , 画面信息本身不足 , 修复困难极大 。用深度学习 , 能够根据已有图像建模 , 做到「修旧如旧」 。
像《葫芦兄弟》 , 人物近景是剪纸风格 , 远景是水墨笔触 。算法可以智能分辨不同的风格来进行处理 , 提升前景的清晰度的同时 , 又能保留远景的朦胧感 。
应用端打磨技术
「智能超分」、「智能插帧」属于标准化功能 , 已封装成可调用的产品 , 向企业客户开放 。
除此之外 , 西瓜视频也提供了内测 , 个人账号可以在「视频剪辑」菜单中点击体验 。
修复中也会遇到新问题 。比如 , 在老影片扫描转数字化的过程中 , 由于采样算法欠佳 , 导致画面中的线条出现锯齿 。
由于这个问题是数字化扫描阶段带来的 , 常见算法和修复工具不能很好地处理 , 火山引擎就针对这种场景单独设计了算法 。
动画|4K修复经典动画 火山引擎的"醉翁之意"在哪?
文章图片
这种处理问题的能力 , 与火山引擎对抖音、西瓜视频进行技术支持的历练有关 。
在视频云产品负责人 Keith 看来 , 视频技术中台的最大优势 , 就是与生俱来的视频播放经验 。简单说 , 就是「同一套人马做 to B 和 to C」 。这让技术团队对 C 端的需求更敏感 。
经过疫情催化 , 音视频企业级服务的市场更加成熟 。
企业级服务商中 , 除了腾讯、阿里云这样的老牌互联网大厂之外 , 声网这样专注音视频实时互动的技术商得到更多关注 。
在此背景下 , 火山引擎在 C 端的历练 , 成为了独特的服务能力 。
比如 , 在打磨播放体验时 , 团队意识到播放第一帧「滑顺感」的重要性 , 于是率先开发了「零首帧」技术 。
首帧即是视频播放的第一帧 。当你被一个视频封面吸引 , 点击播放到首帧渲染出来的耗时小于 200ms 时 , 基本就没有延时和卡顿感 。
视频云团队在这个指标上的追求是小于 100ms 。
人类无感的 100ms 的背后 , 技术程序上需要完成「页面创建」、「网络连接」、「视频解码」、「播放器策略建立」四个环节 。
技术团队针对每一个环节都做了技术优化 , 才实现了播放体验上的「零首帧」 。
这项技术已经运用在客户服务上 。
火山引擎与足球社区 App「懂球帝」共同建立了视频云解决方案 , 帮助「懂球帝」解决了播放中首屏卡顿的问题 。球迷在浏览 App 中的视频时 , 首帧时间降低 30% 以上 。
音视频技术能够缩短时空距离 , 因此 , 远程会议、在线课堂、电商直播是更具潜力的应用领域 。
在 2020 年疫情尚未消退期间 , 财新传媒年度峰会在北京线下举办 。
这是一次多时空串联的任务 , 4 天议程中有 50 多场直播 , 其中既涉及海内外嘉宾连线 , 又涉及峰会全程的线上直播 。
动画|4K修复经典动画 火山引擎的"醉翁之意"在哪?
文章图片
火山引擎技术团队做到了高清视频连线 , 全程无卡顿 。这背后的技术 , 是实时通讯技术(RTC Real-times comunication) 。
各种趋势表明 , RTC 将会成为下一代互联网通信标准的基础和模式 。
未来的视频:流量少 , 更清晰
如今语音和视频功能 , 已经基本满足日常实时通讯 , 但是未来各种场景下的时空串联 , 对技术提出更高要求 。


推荐阅读