在机器人领域,你最先发现的是简单任务的复杂性。对人类来说似乎简单的事情可能有着无限的变量,而我们往往将其视为理所当然。而机器人并没有这样的便利条件。
这正是为什么该行业主要关注结构化环境中可重复的任务。幸运的是,近年来,机器人学习领域取得了一些具有颠覆性意义的突破,该行业正朝着创建和部署更适应性系统的方向发展。
去年,谷歌DeepMind的机器人学团队展示了名为Robotics Transformer(RT-1)的系统,该系统训练其Everyday Robot系统执行诸如拾取、放置和打开抽屉等任务。据团队称,该系统基于13万次演示数据,对于“700多个”任务的成功率达到了97%。
如今,他们推出了RT-2。在一篇博文中,DeepMind的杰出科学家和机器人部门负责人文森特·范霍克表示,该系统允许机器人有效地将在相对较小数据集上学习的概念转移到不同的场景中。
谷歌解释说:“RT-2展示了改进后的泛化能力和对机器人数据之外的语义和视觉理解。这包括解释新指令,并通过进行基本推理(如推理对象类别或高级描述)来响应用户指令。”该系统有效地展示了根据现有上下文信息确定特定新任务的最佳工具的能力。
范霍克举了一个情景,一个机器人被要求丢掉垃圾。在许多模型中,用户必须教导机器人识别什么是垃圾,然后训练它拾起垃圾并丢掉。对于预期能执行各种不同任务的系统来说,这样的细节是不太可扩展的。
他写道:“由于RT-2能够从大量网络数据中转移知识,它已经知道什么是垃圾,并且可以在没有显式训练的情况下识别出来。”“它甚至知道如何扔掉垃圾,尽管从未训练过这样的行为。想想垃圾的抽象性——吃掉薯片或香蕉皮后,它们变成了垃圾。RT-2能够从视觉语言训练数据中理解这一点并完成任务。”
团队表示,从RT-1到RT-2,执行新任务的效率提高了从32%到62%。
这样的技术突破意味着机器人可以更加高效地完成各种不同的任务,而无需进行复杂的重新训练。例如,提到的垃圾丢弃任务,RT-2能够从视觉语言训练数据中理解垃圾的抽象概念,并在没有显式训练的情况下完成这一任务,这展示了其在现实世界中的实际应用潜力。
然而,虽然RT-2的效率得到了显著提高,机器人学习领域仍面临一些挑战。在未来的发展中,团队需要继续解决机器人技术在复杂环境中的可扩展性和安全性问题。同时,关注用户体验和应用场景的实际需求也是至关重要的,以确保机器人技术能够真正为人类社会带来更多的便利和价值。
总体而言,RT-2的发布代表着机器人学习领域的一个重要里程碑,它为机器人技术在未来的发展中开辟了更为广阔的前景。随着越来越多的领域开始采用机器人技术,我们有理由相信,这些适应性和智能性的机器人将在不久的将来为我们的生活带来更多积极的变化和影响。
发布者:5840,转转请注明出处:https://www.5840.cn/lives/451.html
评论列表(0条)