首页AI 新闻
RT-1:机器人学习的新跨越,大规模应用
16

RT-1:机器人学习的新跨越,大规模应用

好说新闻
好说新闻
2023-07-21 01:58

我们在Everyday Robots的工作动力是对未来的愿景——让辅助型机器人在我们的日常生活中与电脑在数字生活中的作用一样有用。几十年来,机器人一直是单一目的的,严格编码用于在特定环境下执行一项任务,如生产线、工厂和其他工业场所。但随着机器学习的前沿进展和人工智能研究的突破,我们的辅助型机器人有潜力改变这种范式,成为真正有益的存在,服务于我们生活和工作的日常空间。

在过去的半个世纪里,计算机硬件和软件的创新,以及最近人工智能和机器学习的进步,让我们相信未来机器人可以学会(几乎)任何事情。在这一过程中,有许多困难的问题需要解决,但我们专注于机器人学习领域。如今,让机器人将过去的学习应用于在各种环境中执行新任务非常困难。然而,我们与谷歌研究合作在强化学习、模仿学习和仿真学习方面取得的突破,再加上最近自然语言理解和机器学习的飞跃,开始为通用型机器人带来更加光明的未来。

今年早些时候,作为我们与谷歌研究持续的合作研究探索的一部分,我们展示了将自然语言理解与机器人的物理能力相结合可以提高机器人的性能。这项名为PaLM-SayCan的研究是首次表明大规模语言模型可以提高机器人在需要执行八个或更多步骤(也称为“长期任务”)的任务计划能力,例如去厨房寻找、选择、取回和送上小吃。

将Transformer架构引入机器人技术领域

在借鉴PaLM-SayCan的研究成果的基础上,我们继续探索自然语言理解与先进机器学习模型——特别是Transformer的结合。Transformer是由谷歌在2017年首创的深度学习技术,能够在大规模文本数据中识别模式和趋势。这项创新迅速被应用于完善搜索查询、改进翻译服务,并继续支撑着最近在能够生成文本、图像或视频的人工智能领域取得的许多进展。

通过将这项技术应用于机器人学习,谷歌研究开发了一种基于Transformer的新型机器学习模型,称为Robotics Transformer或RT-1,使用了来自Everyday Robots的13个助手机器人的超过130,000次任务演示数据、涵盖700多种任务类型。这个模型的独特之处在于它使得机器人可以通过之前见过的图像和自然语言描述的组合进行训练。这使得RT-1就像一个教练指导足球队一样,将机器人的逐时感知数据与语言理解相结合,以确定机器人在达成目标时应该采取的最佳动作。

结果如何呢?RT-1在超过700种任务中的成功率达到了97%,并与基准模型相比,还提高了机器人的以下能力:

  1. 新任务的执行范围提高了25%
  2. 与未知对象的交互与操作能力提高了36%
  3. 在各种环境中执行任务的能力提高了18%
  4. 在包含最多50个步骤的任务中的执行能力提高了54%

研究表明,RT-1的好处可能超出了我们的助手机器人。实际上,RT-1展示了来自不同机器人模型的数据可以结合起来,将机器人在新环境中完成任务的能力提高了17%(约为原来的2倍),而在原始任务上的表现仅略有降低。这一发现特别令人兴奋,因为它表明学习可以在不同类型的机器人之间进行转移,为探索从单一机器人群体学习如何扩展到多种不同类型的机器人开辟了潜在的研究途径。

在RT-1中的仿真数据影响

仿真是我们在Everyday Robots工作的基石。除了在真实世界中接受培训外,我们的机器人还在模拟环境中进行测试,以挑战它们的能力并帮助它们更快地学习。类似于具有高保真度和真实世界物理建模的视频游戏环境,我们的模拟技术可以让数百万台机器人在几乎无限多的虚拟环境中进行训练,显著减少机器人学习新任务所需的时间和真实世界数据。

利用Everyday Robots的模拟环境,谷歌研究创建了一系列在真实世界或模拟环境中助手机器人从未见过的任务、物体和指令,并将其与从真实世界实验中获得的数据相结合。这种方法显著提高了我们助手机器人管理真实世界任务的能力,使其在仅在模拟环境中见过的物体上的处理能力从23%提高到了87%。虽然模拟评估仅限于“拾取并移动”技能,但RT-1展示的领域转移程度强调了将真实世界和模拟数据集相结合的令人兴奋的可能性。

接近更美好的日常生活

从PaLM-SayCan到RT-1,我们持续进行艰苦的工作,使机器人能够在我们度过时间的混乱、非结构化环境中变得有用。虽然我们仍处在旅程的初期阶段,但这些突破仅仅是尖端技术融合的最新例证,将我们逐步推向一个未来,在那个世界中,助手机器人有望在我们的日常生活中变得真正有用。

转载自Alexander Herzog查看原文

全部讨论

no data来都来了,坐下聊聊