『量子位』中国女博士的“水淹食堂”大法:单目视频重建3D场景,毫无违和感( 二 )
评估的指标一共有三个 , 覆盖模型的“测光误差”(Es)、“(不)稳定性”(Ed)、“漂移程度”(Ep) , 都是反向指标 , 数值越小 , 证明模型效果更好 。
从下图中可以看出 , 无论是静态场景还是动态场景 , 论文中提出的深度估计算法 , 在各个指标上都是最优 。
本文插图
从直观的结果中也能够看出效果的差异:
本文插图
本文插图
不仅精度和几何一致性更高 , 视觉效果也更加稳定 。
此外 , 为了评估的完整性与公平性 , 他们还在三个公开数据集上 , 与这些模型进行了定量比较 , 分别是:TUM数据集、ScanNet数据集和KITTI 2015数据集 。
下表展示的是ScanNet数据集上结果 , 论文中提出的方法虽然不是最优 , 但与最优算法的差距并不算大 。
本文插图
来自中国女学霸 , 本科毕业于上海交大
这一研究成果来自华盛顿大学、Facebook等研究机构 , 一共有5名学者参与 。
一作名为罗璇 , 是华盛顿大学在读博士 , 2015年毕业于上海交大ACM班 , 是戴文渊等大神的直系学妹 。
本文插图
本科毕业之后 , 先后拿到加州伯克利大学、华盛顿大学等高校Offer , 为了追求“虚拟视觉”而选择了华盛顿大学 , 这也是她从高中就开始关注的领域 。
去华盛顿大学读博之后 , 她先后在迪士尼、谷歌等知名企业实习 , 当前的这一研究成果 , 是她在Facebook实习期间的研究成果 。
第二作者是Jia-Bin Huang , 弗吉尼亚理工学院助理教授 , 本科毕业于台湾国立交通大学 。 论文的其他三位作者 ,都来自Facebook , 分别是Richard Szeliski、Kevin Matzen、Johannes Kopf 。
关于这一研究 , 他们在结论部分提到了不足之处——比较依赖此前的研究成果 , 比如用COLMAP估计单目视频中摄像机的姿态 , 依赖FlowNet2建立几何约束等等 。
这些方法的不足 , 也直接影响到了罗璇等人的研究 。
另一个值得改进的地方在于 , 它不支持在线处理 , 训练244帧的视频需要约40分钟 , 如果想要实际的生活中 , 还需要进一步优化 。
但从广大网友的山呼海啸般的反响中 , 也能够看到算法一旦实现 , 用户是肯定有的~
【『量子位』中国女博士的“水淹食堂”大法:单目视频重建3D场景,毫无违和感】你期待吗?
推荐阅读
- 海峡生活汇印度对中国虎视眈眈,我国将如何迎接挑战,英国仍想着事后清算
- 董明珠说中国制造不能没有格力,事实真的是如此么?
- 中国财富网你买对了吗?“一杯咖啡”引发的索赔,董责险
- 环球时报热点 离中方的最终决定还有10天,澳大利亚担忧“中国关税报复”
- 中国青年网美众议院调查特朗普防疫应对措施
- 『中国』相约云上!省发改委牵头召开云上2020年中国品牌日活动福建分会场新闻通气会
- 【核武器】中国四艘轻型航母现身,增加核武器数量呼声高涨,你细品
- 冷门体育知识今落叶归根回国执教,中国体操天才入美国籍后培养数位世界冠军
- 中国质量报山西记者站精准助力台骀山景区复工复产,迎泽市场监管多措并举
- 缓缓静水流深不语中科大、北大、南京大学进入前三,2020中国一流大学排行榜出炉
