新智元 定了!AI视觉泰斗朱松纯教授归国就任北大人工智能研究院院长( 二 )
文章图片
DavidMarr分出了三个层次来解决这个问题 , 分别是计算(其实应该说成是表达)、算法、和实现 。
首先 , 在表达的层次 , 如何把它写成一个数学问题 。 任务是什么?输出是什么?这是独立于解决问题的方法的 。
其次 , 对这个数学问题去求解时 , 可以选择不同的算法 , 可以并行或者串行 。
再次 , 一个算法如何在硬件上实现 , 可以用CPU , DSP , 或者神经网络来实现 。

文章图片
除此之外 , DavidMarr还理清了视觉到底要计算什么 。
Marr提出了一个系列的表达 , 从primalsketch(首要简约图) , 到2Dsketch(深度简约图) , 到3Dsketch 。
这里面还包含了纹理、立体视觉、运动分析、表面形状等等 。 Marr认为 , 视觉计算不是单纯去求一个解 , 而是一个连续不断的计算过程 , 越看、越琢磨 , 可能得到的理解就越多 。
值得一提的是 , Marr在1978年冬诊断得了急性白血病 , 在得知来日无多后 , Marr就赶紧整理了一本书《视觉:从计算的视角研究人的视觉信息表达与处理》 , 去世时年仅35岁 。

文章图片
朱松纯和同事在这本书上花了8年时间 , 把Marr提出的早期视觉概念 , 包括纹理、图像基元以及原始简约图等转换成了一个统一的数理模型 。
从此 , 视觉就可以从纯粹的理论、计算的角度来研究了 。
除了视觉的统计建模和计算理论 , 朱松纯还实现了图像与场景的解译(parsing)计算框架 , 扩展了模式识别创始人傅京孙先生的句法模式识别理论 。
自2010年以来 , 朱松纯将计算机视觉与认知科学、自然语言理解、机器人等学科结合 , 探索他所称的「人工智能的暗物质」——占95%的、无法通过感知输入观测到的智能 。
现在 , 朱松纯团队构建了一个大规模、物理逼真的VR/AR环境 , 用于训练和测试负责执行大量日常任务的自主AI智能体 。
这些智能体可以整合视觉 , 语言 , 认知 , 机器学习和机器人技术等领域的能力 , 在此过程中发展物理常识和社会常识 , 并使用认知架构与人类进行交流 。
熟悉朱松纯教授的人 , 对他严谨的治学精神 , 也从不吝惜赞美之词 。
他对数学一丝不苟 , 对视觉领域有着一流的直觉
微软亚洲研究院视觉组研究员代季峰 , 曾经在朱松纯教授的VCLA实验室访学一年多 , 为我们分享了一些朱松纯教授的学术人生 。
对视觉领域大方向有着一流的直觉
朱松纯教授的实验里学生人数较多 , 自然要用雄厚的funding资金来支撑 。 朱教授在最近几年应该都是美国大学视觉界里funding最多的教授(不知道是不是要加个「之一」) 。
从2011年起 , 朱老师的实验室 , 作为PI拿到的资助超过4000万美元 , 其主要原因就是其「研究思维超前」 。
能够拿到这些大funding , 意味着朱教授对这个领域的大方向「有着一流的直觉以及领先和准确的把握」 。
而朱教授这种的「第六感」在多年前就已经有所体现 。

文章图片
2012年 , 朱松纯教授主持的一个MURI大项目在UCLA开会 , 他上台讲了一通「visionmeetslanguage」 , 说视觉和语言的结合会是一个重要的问题 , 比如看到一整个图片 , 系统应该输出一段话描述它 , 比如看到一个boundingbox区域 , 要描述这里面发生了什么 , 这个用一个hierarchical的And-Orgraph该如何实现 。
当时很多视觉领域的大佬都觉得有些天方夜谭 。 没想到过一两年 , 这就是红极一时的VQA任务 , 不过是用神经网络实现的 。
「能够提前感知到未来的大方向」 , 这是顶级的research感觉 , 这也是朱松纯教授最厉害的地方 。
推荐阅读
- 募集资金|28.78元!中金公司发行价定了 募资“补血”超130亿
- 北晚新视觉网|谁发射谁害怕?印度导弹打偏200公里
- 菠萝娱评1|爆款剧预定了,张嘉译又一都市剧开拍!演员班底堪称顶级配置
- 人工智能华为与南昌共建智慧视觉第一城,助力智慧南昌建设
- Fashionlog|群星璀璨金鹰展鹏,公主王子齐驾到,晚会即高颜值视觉盛宴
- 支付宝|支付宝、微信绑定了银行卡,这3张照片要删除,避免财产损失
- 王者荣耀|王者荣耀:限皮投票18号实况,前五基本定了,第六断层太大,甄姬玩家哭了
- 华为发布首个基于5G MEC云边端协同的工业视觉解决方案
- 多伤努力吧|粉丝们不淡定了!,杨清柠身材有多性感?看到缺少的一只“胳膊”
- 幽默搞笑段子集锦|最终确定了情侣关系,幽默笑话:和隔壁的女邻居同居半年
