中年|高文院士：城市大脑的「痛点」与「突破」丨CCF-GAIR 2020( 五 ) |院士|痛点|

要想把视频编码做得好，算法要做得很精，随着时间的推移，我们可以用计算、带宽把这些东西一点点都去除掉。

本文插图

当然，这些年我们除了不停地优化算法之外，我们还提出了一种背景建模的技术，使得编码效率在原有的技术上又可以提高一倍。
这里有很详细的一些数据测试作为依据，而且这些东西都已经发表论文，比如2014年我们在TIP发表了一篇论文，里面有这样一些研究结果。

本文插图

AVS2在2016年已经成为我国的标准，同时它也是IEEE1857标准的第四部分。现在我们做AVS3的时候，就是IEEE1857的第10部分。

本文插图

本文插图

AVS标准是在2019年3月份第一版就发布了， H.266一直到今年7月份第一版才发布，我们超前了H.266有一年三个月，这是有史以来第一次。

本文插图

AVS3这个标准去年3月份第一版发布以后，去年9月份海思就把芯片做出来了，在阿姆斯特丹的一次广电展上，这款芯片一经面市，引起了很大的轰动。

本文插图

它可以支持AVS3、8K解码，是120帧的，这个芯片现在已经装配在很多4K、8K电视、机顶盒等等。
第二个使能技术就是特征编码，这是非常关键的一个使能技术，这个技术里面它的标准有两部分核心的内容，一部分叫CDVS ，一部分叫CDVA ，这两部分现在也都是国际标准MPEG-7里面的两部分，一个是第13部分，一个是第15部分。

本文插图

为什么要做视觉特征的压缩呢？因为根据不同的特征，提取出来的特征数据可能很大，如果不压缩的话，搞不好特征数据比图像本身都大，所以要么你就传个图像过去，要传特征的话数据太大，所以就要对它进行特征压缩。
怎么进行压缩？原来有不同的考虑，如果是先把图像编码传过去，再提取特征，再进行识别，和先把特征提取出来，然后把特征传过去再识别，这两个其实有一个剪刀差，可能有时候识别率会先差百分之二三十。

本文插图

就是说先压缩了以后，可能有一些比较有用的特征丢了，因为所谓编码压缩，它是保留公共部分，把一些非公共的、非常见的东西压缩掉了，而非常见的部分恰恰可能是特征，所以你把这个打磨掉以后，它的识别率可能就下来了，所以我们是先提特征，再在云端技术识别这样一个技术策略。
当然先提特征，怎么样提的特征体量比较小，我们初期是采用手工作业的策略，当然手工特征怎么支持深度学习，这是另外一个问题，后面我们做了第一版以后，又专门做了一个面向深度学习的编码压缩的框架，这个主要是给小视频来做的，有了这两个部分以后，基本上可以应对图像特征编码和视频特征编码这两个需求。

本文插图

图像特征编码就是CDVS ，视频特征编码就是CDVA 。 CDVS是手工特征的，里面使用的是一个类SIFT的特征集， SIFT大家都知道，当你给的比特数据比较少的时候，它就给一些比较宏观的特征。

中年|高文院士：城市大脑的「痛点」与「突破」丨CCF-GAIR 2020( 五 )

推荐阅读

中年云南铁塔：积极作为勇当主力军

?中国新闻网|?蚂蚁上市在即马云财富要甩马化腾等富豪几条大街？

张天爱|张天爱是如何保持身材？不吃油炸不吃零食，连鸡翅都是舔一下

「财经上下游」美国企业会将供应链撤出中国吗？普华永道调研：超七成说不会

经济观察报汽车职业经理人跳槽困境:你擅长的可能不再是车企想要的

青蛇电影歌曲青蛇主题曲

沙滩排球题材剧《燃！沙排少女》杀青，张雪迎许龄月主演

中国那么多家庭不幸福的主要原因是啥

澎湃新闻|中科院院刊建议：支持深圳、青岛、大连、喀什升格为直辖市

人民日报■谢谢你，英雄的武汉人民

「人民日报」惊悚！把使用过的口罩放大1000倍,才发现…，

汽车舆生活|百公里加速4.4秒，最怕下雨天，河南偶遇一辆“蹦蹦”

前端js中http跳转https报403错误，请求头referer详解

宠物|俄罗斯一女子开车载熊兜风画面引网友围观

彩机云锦|为什么越来越多离异女人不选择二婚？看看过来人怎样说

【库兹马】姐弟恋！美媒：库兹马金屋藏娇和白癜风超模一起隔离

运动后全身酸痛怎么回事啊？

吕丽萍|吕丽萍夫妇疑回国养老？吕丽萍曾为美国庆生，公开哭悼安倍晋三

吃XO酱上火吗？XO酱的营养价值有哪些?

大熊闻三方|第1位被严重抹黑，第3位死后成了神仙，三国时真正的七大名将