涌入
除了创业公司外,越来越多主业从事汽车甚至手机的厂商也开始加入机器人研发大军。这背后是包括多模态大模型、空间计算等关键技术快速迭代打开了更大可能性。
如果将具身智能进行拆解,主要包括大脑、小脑、四肢三个关键构成。其中大脑主要由多模态大模型提供能力支持,小脑部分则是各类控制系统、人工智能技术辅助;四肢主要涉及机械臂、灵巧手等机械结构和传感器能力。
不难发现,近些年来随着AI大模型被应用到各类终端、汽车产业向智能化和电气化发展,构成机器人的多条关键技术要素都与既有产业有了重合。
一名MR领域从业者对21世纪经济报道记者分析,AR未来在推动具身智能发展方面将发挥重要作用。“因为具身智能的发展有两大关键能力:第一视角多模态大模型和能完成人类动作的能力。智能眼镜产品在使用过程中,就会逐渐搭建起一个第一视角的多模态大模型,其中还会逐渐积累主动意图、交互等数据,进而帮助具身智能实现第一阶段的能力积累。”
vivo在2023年就提出未来计划切入人形机器人领域,近日vivo执行副总裁胡柏山对其逻辑进行了分析。“机器人的关键路径,一方面是空间感知,MR眼镜做好后,机器人的空间感知能力就不会出问题;vivo蓝心大模型持续迭代,会让机器人有强大的‘思考’能力;人形机器人的肢体,占整体技术架构比重的20%,vivo可以补齐相应能力。人形机器人将来可以用在医院等场景,帮助解决养老产业医护力量不止等难题。”
但从技术到真正成熟落地,显然并不容易。胡柏山坦言,机器人要真正能手脚灵活、有较强大脑决策能力,成为人们理想中的产物,预计可能需要十年甚至十五年以上,但是可以分阶段实施,规划阶段性产品周期。
在他看来,目前规划进入生产线的机器人,大多只能完成特殊场景的特定工作,本质还是工业机器人,不过局部如“手脚”能力会进步较快。“我们内部认为,机器人的用户场景需求比较明确,但技术解决路径不完全明确。可以随着技术逐渐成熟,陆续解决局部场景能力。”
整车厂的进入,某种程度上与产业链存在交集有关。特斯拉旗下Optimus(擎天柱)此前展示“进厂打工”的场景正是分拣车用电芯,机器人本身的动力系统也在改变。
“机器人原本采用液压驱动路线,但在行业发展多年的波士顿动力机器人公司,此前发布的机器人采用了电驱路线,这与目前汽车行业的发展趋势十分接近。考虑到汽车形态也适合发展智能体,波士顿动力公司选择的纯电路线也值得我们进一步思考。”一名行业投资人对记者分析,“我们持有一种未必对的观点,具身智能最终的表征未必是人形,大概率是根据细分垂类应用,更好适配人类交互环境的形态。因为在一些垂直场景,未必是人类形态更有利于场景落地。”
群智咨询(Sigmaintell)执行副总经理兼首席分析师陈军对21世纪经济报道记者指出,2024年全球机器人出货规模约4700多万台,2025年将实现近6000万台出货量,维持18%年增速。
“机器人主要分为服务型机器人、工业机器人、特殊用途机器人(如急救机器人等)。其中占据市场80%比重的依然是服务型机器人,这其中有近70%用在清洁场景,典型就是扫地机器人、擦窗机器人等。”他续称,群智咨询监测发现,其中人形机器人的量还非常小,2024年总体量不到4000台,预计2025年全球出货约5000台,显然仍处在发展前期。
不过随着人工成本越来越高、融合AI能力,陈军认为,机器人赛道虽然目前体量较小,但处于增长较快的赛道。
“随着机器人未来真正进入家庭,其想象空间会很大,可能会替换掉家用摄像头、‘闺蜜屏’、智能音箱等产品,因为机器人具备很高可移动性,可以在很多空间找到应用落点。”王吉平指出,这也是终端厂商要积极布局的重要原因,机器人在未来家庭中将充当“智能助理”的功能。“因此机器人的市场前景非常广阔,目前还在产业发展初期。”