随着大模型的前进与普及,具身智能俨然已经成为了下一波技术浪潮的当红炸子鸡。真正的具身智能什么时候来到,我们离机器人通用模型还有多远?

1月11日,AI+ 和锦秋基金于 1 月 11 日共同举办了这场机器人技术圆桌论坛,邀请了多位来自产业与学界的重量级嘉宾,涵盖从工业安装到灵巧手操作,再到基础模型与硬件系统等多个方向。具体背景如下:

在此次圆桌论坛中,嘉宾们围绕机器人闭环安全、仿真与真实环境的差距、通用模型与垂直场景的选择等热点问题展开讨论,为新一代机器人应用与落地带来了前沿观点与务实思考。以下是这次panel的采访稿:

1. 机器人应用中怎么实现完整闭环?

Q1(主持人Lynn)

在机器人实际应用里,想实现安全且完整的闭环,往往需要同时解决感知和控制的问题。我们看到过去有些公司尝试用如diffusion等方法做闭环,但可控性不足。也有人依靠Segment Anything Model做场景重建,仍受到视角限制。请问各位嘉宾,当前要想在真实场景里实现可靠的闭环控制,面临的主要障碍是什么?仿真与真实环境之间的差距又该如何弥合?

A(丁雨,Roboforce)

想真正做闭环,一种方式是直接在真机上实验,但成本极高;另一种则是使用仿真。仿真可在一定程度上替代真实测试,但感知层面的渲染以及物理层面的摩擦力、电机模型等都和现实有差距。所以我们希望有一种高保真的仿真,让机器人在其中“见过”足够多变量,学到通用规律,然后再迁移到真实世界中。这样才有机会在现实里实现闭环。

A(陈涛,Dexmate)

仿真主要有两大gap:视觉的逼真度与物理的准确度。视觉渲染若要做到电影级别,需要海量算力和资源;物理属性里,材质、重力、摩擦系数等都很难精确模拟。所以理想策略是用仿真先做大量训练,再把真实数据做校正。若控制器够鲁棒,不需要对每个细节进行极度精确建模,也能在现实中有相当的外推能力。

A(黄迪,灵巧手创业)

此外,还有系统管理层面的问题。机器人硬件、关节、电机、系统延迟等方面,仿真与现实往往不完全吻合,需要进行system identification或其他方法去估计和弥补这个误差。目前在一些抓取、分拣等子任务上已有论文探讨如何让仿真结果与真实世界保持关联,但距离通用的闭环安全方案还需要更多探索。

2. 机器人模型的主流技术路径

Q2(主持人天宇)

在自动驾驶领域,Waymo依靠海量真实行驶数据,另一类公司则先用大量预训练再做真实校正。机器人界也有类似争论:有人偏好依赖真实部署,不断修正;有人想先构建庞大的模型再落地。各位怎么看当前机器人行业的主流混合模型(Hybrid Model)路径?是否已经有某种成熟的做法?

A(丁雨,Roboforce)

自动驾驶已经有相当规模的真实上路数据,但机器人尚未到处跑。因此大家多采用结合仿真与真实场景的小范围验证。根本原因还是数据。机器人实际使用的数据成本高,无法像自动驾驶那样规模化。算力和模型架构并非最大瓶颈,关键是如何获得足够多样且有质量的交互数据。

A(陈涛,Dexmate)