「人工智能」利用移动AR数据，谷歌训练了一款可在2D图像中识别3D的AI框架 |Google|2019科技之光|无人驾驶|

3月12消息，谷歌AI团队公布了一种全新的移动端3D识别方案：Objectron ，其特点是可通过AI模型，在2D图像中预测物体在场景中的位置、尺寸和方向，可用于机器人、自动驾驶汽车、图像检索、AR等场景。

本文插图
此外， Objectron的研发团队开发了一种图片标记工具，可以通过分屏视角显示2D视频帧，快速实现对3D边界框的手动标记。这些3D边界框将叠加在点云数据、摄像头画面和识别到的平面上面。
标采访人员在分屏视角（3D视角）中标记3D边界框后，可以在2D视频帧中进行验证，而对于静态图像，标采访人员只需在单个帧中进行标记。为了更精准定位目标物体，标记工具还会使用AR session数据中的实际摄像头信息来确定该物体在所有帧中的位置。
接下来为了训练AI模型，谷歌团队使用了移动端AR session数据（包括摄像头图像、稀疏3D点云、预测光线、平面区域等），弥补了移动设备不具备高端3D传感器的难题（市面上大多数3D数据依赖激光雷达等3D传感器，对日常物体的3D标记数据却很少）。
除了真实环境的数据外，还使用了合成的AR数据来提高AI预测准确性。为提高合成数据的质量（提升了10%准确性），谷歌研发了一个AR合成数据生成方案（AR Synthetic Data Generation），特点是可通过调整摄像头角度、识别平面、预测的光线数据，来生成符合物理规则的3D位置信息，以及符合场景的光线，让融入在具有AR session数据的场景中的虚拟物体看起来更自然。
同时，谷歌表示：由于SoC等硬件设备局限，用手机等移动设备识别3D目标是一个棘手的问题，而在2D视频、图片中识别物体的3D信息更是难上加难（由于缺乏深度数据，以及画面复杂性等因素），通常只能识别和标记2D信息。
【「人工智能」利用移动AR数据，谷歌训练了一款可在2D图像中识别3D的AI框架】因此利用开源跨平台框架MediaPipe ， Objectron可实现在旗舰级移动设备中实时标记3D边界框的任务，比如在搭载Adreno 650移动图形芯片的LG V60 ThinQ、三星Galaxy S20+、索尼Xperia 1 II等手机上，刷新率约可达26fps 。

「人工智能」利用移动AR数据，谷歌训练了一款可在2D图像中识别3D的AI框架

推荐阅读

比例|注意！千禾味业：控股股东伍超群拟减持不超过约1997万股

台积电|台积电2nm真的在研发中吗？

新开的淘宝店铺怎么装修淘宝店铺装修步骤流程2020

斗玩网|难怪姿态被抓也不改！Rita学会战术后退，女仆条纹白丝秀绝对领域

今日玉环丨梅菜扣肉

我娱有约2|张萌身份信息被盗，偷盗者用她信息办理航空卡，比里程被盗更可怕

青年|杀女朋友过七夕？德云社演员的“口德”和“艺德”呢？

|厨房装修最容易犯的三大错误，注意避开，否则会给自己挖坑！

快度体育|快度街拍：小姐姐一条浅绿色短裤，展示出优雅双腿，舒适又清爽

庙会的起源和习俗介绍

气质|气质高贵的人从不赶潮流，都偏爱日系风，穿上一看就“很有钱”

▲榜一榜二撒狗粮，服务器排队爆满，榜三：让我下去！

受害者对加害者产生了感情叫什么！鱼会对主人产生感情吗，鱼到底有没有感情?

小纪谈育儿|但不觉得饿”孕期孕吐有多可怕？，“我已经2天没吃饭了

婴儿体温比成人高吗？

庄妃是孝庄皇后吗?顺治的静妃是什么皇后

太平洋电脑网|PS 游戏 FF7 重制版售出五百万套，销量最高的数字版

义城|魔道祖师义城将直接决定后世篇的成败，它是否会完美呈现

虎扑|希望他们下赛季再创辉煌，默尼耶：欧冠决赛时我支持巴黎

四岁女孩走失，消防出动无人机寻找，结果把众人吓出一身冷汗…