小米|小米造“人”比特斯拉还快:首款全尺寸人形仿生机器人CyberOne发布( 二 )
离家前忘关水龙头?它就能识别滋滋水流声并提醒你 。
据了解,CyberOne还实现了「拖动示教学习」这项特别的功能 。
所谓拖动示教学习,就像是父母手把手教你第一次学会用上了筷子 。
这动作对人来说简单,但对机器就难度很大了 。不仅要求硬件机械臂是「活」的,可被移动,反驱的形式对关键部位电机性能要求更高,也是小米团队最初要求的关键指标 。
除此之外,机器人还要通过传感器和软件层能够记忆学习动作,重复执行,工程师们希望通过该功能实现,让机器人模拟人的学习过程 。
看到这,大致能得出些不吹不黑的结论——
小米新发布这个人形机器人的确挺像样,不仅外观,其各方面组件的确满足人形机器人要求 。
无论行动速度,还是抓握力,再到突出的交互能力和AI算法对环境语义的识别判断,能看出这台CyberOne更面向/服务于人本身 。
不管怎么说,小米居然不声不响,闪亮登场一个全尺寸人形仿生机器人,还是出乎了所有人意料 。
人形机器人,有多难?
人形是解决综合问题最高效的形态之一,是机器人领域公认的终极方向,同时也是技术难度最大、需要投入最多的 。
毫不夸张的说,全尺寸人形仿生机器人是“机器人皇冠上的明珠” 。
原因也不难理解 。
身体结构上,人类双足直立行走、双手操作工具都是历经上百万年进化而来,靠的可是自然选择的力量 。
想用完全不同于生物的一套材料、靠人为设计去模仿逼近,工程难度可见一斑 。
文章图片
行为和决策上,人形机器人要做到和人一样、解决复杂问题问题,这就就需要做到对环境的全面理解,需要多模态结合的推理和交互,除了视觉、听觉,还要考虑更不成熟的嗅觉、触觉等 。
文章图片
最后还有点现实原因,人形机器人行业还没有机器狗那么成熟,不要说开源方案了,连论文都没有几篇可以参考 。
小米人形机器人项目的负责人向迪昀表示,这次难度和去年的机器狗铁蛋不在一个level上 。
看上去理论似乎很健全,但怎么做、技术如何演进,谁也没有正确答案 。
纵观目前市面上成熟的项目,从产品迭代路线来看大概能分4步:先做下半身站立,到下半身行走,组装上半身,最后是全身的动作协同 。
小米则通过在智能制造和之前CyberDog机器狗项目上的技术积累,最终决定下半身和上半身并行推进,项目进展较快 。
机械方面对应人类行为的执行部分,一般由小脑控制 。但如果只做到拟人运动能力,充其量可以称之为机器 。
只有拥有了感知-认知-执行的大脑能力,才真的称得上机器人 。而大脑能力也是仿生人形机器人的技术制高点 。
从已公开的信息来看,CyberOne首先拥有空间感知、认知能力 。
CyberOne搭载自研Mi-Sense深度视觉模组,结合AI交互算法,使其不仅拥有完整的三维空间感知能力,更能够实现人物身份识别、手势识别、表情识别,CyberOne真正做到了不仅看得到也能看得懂 。
文章图片
但相比于机器狗,人的世界中信息量级堪称爆炸 。就以简单的路径规划为例,目前最全面、技术难度最高的路径规划为自动驾驶路径规划 。
智能汽车路径规划除了解决机器人从A点到B点外,还需要在过程中针对各种情况进行语义标定,例如停止的障碍车辆、地上的行车线、运动中的行人等等,从而对其作出预判,保证安全舒适行车 。
虽然CyberOne得到了来自小米自动驾驶团队的技术帮助,但自动驾驶仍然是在道路交通有限场景下的路径规划技术,而人形机器人则是全场景的路径规划,面对的情况更加丰富,需要对环境语义的标定更加复杂 。
CyberOne同样拥有情绪的感知和认知能力,这部分能力则是师承小米内部小爱同学团队 。
小米人形机器人项目的负责人向迪昀表示,小爱同学面向大众展现的能力只是冰山一角,其实小爱团队很早就开始搭建情绪训练模型和环境语音语义模型,这方面技术对软硬件平台要求较高,尚未开放给大众用户,而让CyberOne抢了“首发” 。
推荐阅读
- 腾讯|福布斯2022中国数字经济100强出炉:腾讯第一 小米第十
- 小米|小米向3142人奖励股票 价值9.42亿元
- 小米|小米平板4 Plus正式退场:官方宣布停止售后服务
- 教师|宇宙的尽头,考教师编
- 明星|这些明星改变了我对“方脸”的偏见,高级显气质,而且越老越耐看
- |在职场上,别把“顺其自然”当成“最好”
- 防晒|马化腾的企鹅“瘦身了”,收入下滑,但是员工平均工资8.5万以上
- |领导问你“为何辞职”的时候,千万别说这些话,领导都会生气
- 刘奕君|“向往的生活”和师哥一起出海
- 美国|美国“番茄危机”悄然而至:高温干旱致农作物歉收
