DeepMind,Google Brain和/或OpenAI将努力为机器人技术构建基础模型

斯坦福大学的一个研究小组去年提出了“基础模型”这一术语,指的是在广泛的数据上训练出来的大规模人工智能模型,它不是为某项特定的任务而建立的,而是可以在广泛的不同活动中有效执行。

基础模型一直是人工智能近期进展的一个关键驱动力。今天的基础模型强大得令人惊叹。但是无论它们是像GPT-3这样的文本生成模型,还是像稳定扩散这样的文本到图像模型,或者像Adept这样的计算机行动模型,它们都只在数字领域运作。

在现实世界中行动的人工智能系统,例如自动驾驶汽车、仓库机器人、无人机、仿人机器人等,到目前为止仍然大多没有被新的基础模型范式所触及。

这种情况将在2023年改变。预计关于机器人基础模型这一概念的早期开创性工作将来自世界领先的人工智能研究机构:DeepMind、谷歌大脑或者OpenAI(尽管后者去年从机器人研究中退了一步)。

为机器人建立一个基础模型,换句话说,为物理世界建立一个基础模型,这意味着什么?在高层次上,这样的模型可能会在来自不同传感器模式(如相机、雷达、激光雷达)的大量数据上进行训练,以发展对物理学和现实世界物体的普遍理解。不同的物体如何移动,它们如何相互作用,它们有多重、多脆弱、多柔软或多灵活,当你触摸、掉落或投掷它们时会发生什么。这种现实世界的基础模型,然后可以针对特定的硬件平台和特定的下游活动进行微调。