清华大数据论坛:快手AI技术副总裁郑文分享深度学习应用( 七 )

人脸是一个很重要的维度 , 因为人脸往往包含了人所关心的最主要的部分 , 会对人脸区域进行检测 , 识别年龄、性别、表情等 。

另外一个维度是图像层面 , 会对图像进行分类 , 如图像的场景是什么;此外也会检测图像中有哪些物体 , 还会进行图像质量评估 , 以及利用 OCR 技术从图像中提取文字 。

音乐是影响视频感染力很重要的一部分 , 可以从视频里识别出音乐类型 , 甚至可以对音乐进行结构化分析 , 分离伴奏和歌唱部分 。

语音也是视频非常重要的维度 , 往往从图像中可能并不能很好地得到视频所传达的信息 , 这时候语音就非常重要 , 会把语音识别出来转化成文字 , 也会通过语音去识别人物的身份、年龄、性别等等 。


推荐阅读