0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

UC伯克利新机器人成果:灵活自由地使用工具

jmiy_worldofai 来源:YXQ 2019-04-15 09:03 次阅读

之前我们刚刚介绍了加州大学伯克利分校 Pieter Abbeel 教授领导伯克利机器人学习实验室(UC Berkeley's Robot Learning Lab)开发的会叠衣服的家务向机器人 BLUE,今天伯克利人工智能实验室(BAIR)这边也带来了一项新的机器人科研成果——教会机器人使用工具完成任务。这篇论文的作者之一是知名青年机器学习研究员、谷歌大脑研究科学家ChelseaFinn,她目前正在BAIR做博士后。论文成果的介绍博客编译如下。

一个有难度的目标:学习使用工具

在许多动物身上,使用工具的能力都来自于观察学习和动手尝试两者的共同作用。比如,大猩猩可以通过观察自己已经掌握了技能的同伴学会如何用树枝从白蚁窝里“钓”白蚁吃,人类也观察到卷尾猴能够把树枝作为扫和拨的工具,把较远的食物弄到他们身边。有人也许会提出这只不过是猴子们依葫芦画瓢,但这篇论文的作者们认为使用工具的能力显然体现了更为高级的智慧。

大猩猩钓白蚁

在这项新研究中作者们探索的问题是:我们能否让机器人也拥有相似的使用工具的能力——通过观察和自己动手实验学会使用工具。

在执行复杂的多物体控制任务时,有一项必须的要素是理解物理层面的因果关系,所以预测不同的物体之间会如何相互作用就非常关键。在之前的视觉深度强化学习研究(https://arxiv.org/abs/1812.00568)中,作者们已经探究了如何在机器人与世界的无监督交互过程中学习包含因果关系的视觉预测模型。在学习到这样的模型之后,机器人就可以开始规划并完成一系列简单的任务,包括叠衣服、整理物品。不过,如果考虑到使用工具的任务中更为复杂的物理交互,比如用扫帚把尘土扫进簸箕里,非指向性的动手实验就不够了。

因此,考虑到动物们是如何学习的,作者们设计了一个新的算法,它可以让机器人通过类似的模仿、互动的范式学习如何使用工具。具体来说作者们展示了,借助一组演示数据以及无监督的动手实验,机器人可以学会把新的物体作为工具使用,甚至可以在传统工具缺失的情况下灵活使用现有的工具完成任务。更进一步地,根据任务要求的不同,作者们的方法还让机器人有能力决定是否使用当前给定的工具。


作者们提出的方法让机器人有能力学习如何把不同的物体当作工具以完成用户给定的任务(第一行图中用黄色箭头标出)。任务中并没有指定机器人必须使用给定的工具,但机器人决定使用它们。

在指导中学习视觉预测

从演示中学习

首先,作者们需要使用一个演示动作数据集,其中展示了各种不同的工具是如何使用的。由于最终的目标是希望学习到一个具有多种多样的工具使用能力的模型,作者们采集的演示动作数据也就包含了多种不同的工具和多种不同的任务。对于每一个演示,作者们都让机器人自己的摄像头录制了图像序列和动作指令。

几个引导运动的例子

通过这些数据,作者们得到了一个模型,它可以提出把当前场景内存在的物体作为工具的运动序列。并且,为了能够从演示中捕捉更为丰富的行为,这个模型的输出形式是不同动作序列的分布。

为视觉预测模型的学习收集无监督数据

由于作者们希望机器人的行为不要局限于演示数据中出现的那些动作,并最终泛化到新的物体和新的情境中,他们就还需要很多不同的数据。最理想的来源当然是由机器人自己采集,而且是通过大规模可拓展的方式。比如,作者们希望机器人能够理解抓取姿态不好之类的小错误对后续的动作会有什么影响,所以他们就让机器人从现有的经验基础上继续动手实验、继续收集更多的数据。

具体来说,论文作者们设计了两种不同的数据自动采集方式:一种方式是执行随机的动作序列,另一种是从上一节中提到的动作序列提出模型中采样。后一种方式中,机器人可以把工具拿起来然后在空间中随机移动它。对于学习多物体的交互方式来说,在这一环节中学习到的经验非常重要。

根据日常物体和工具进行无监督交互学习

最终,作者们使用的数据集一共由这几部分构成:专家演示、机器人使用多种不同工具的无监督实验、以及BAIR机器人交互数据集中的数据。作者们用这些数据训练了一个动态模型。模型的实现方式是循环卷积神经网络,它在每个时间步骤的输入是前一副图像和一个动作,输出是一副生成的图像。

在指导中学习规划

在测试时,机器人可以使用模仿学习训练的模型来指导规划过程,然后用预测模型来觉得哪些动作可以让它完成目前的任务。

新任务的创建需要用户给定关键点的移动。比如下图中,我们希望机器人把地上的垃圾扫到簸箕中,就在图中选中垃圾的中心点,然后画出希望的最终位置。用这种方式指定任务并不会告诉机器人如何使用工具,在有多种工具可以选的环境下甚至都没有指明要用哪一种工具,机器人需要自己思考并规划。

作者们使用了一个简单的基于采样的规划过程,它会使用动作提议模型和图像预测模型的输出,并让机器人有能力用多种不同的工具和物品完成多种不同的任务。具体来说,动作序列最初是从随机采样的,然后,根据图像预测模型可以预测出每一种动作序列规划的结果。

同一个初始场景中,针对不同动作序列的预测结果

通过选出当前最佳的规划并根据它生成一个分布,系统可以进行反复的迭代采样,在当前最佳的规划的基础上一直优化改进,最后在机器人上执行。

系统运行框图

实验

作者们对这种方法进行了实验,让它使用新的工具执行用户设定的目标。

从左到右:初始场景和任务目标;根据最佳运动规划的预测结果;机器人的实际执行结果

在前面提到过的清扫任务中,机器人可以抓起附近的扫帚,高效地完成任务。

在另一个场景中,虽然机器人从未见过海绵,但它能够思考如何用它把盘子中的碎渣扫走。

在下面的例子中,作者们设定只允许机器人在绿色阴影范围内移动,目标是把蓝色圆柱体向自己的方向移动。显然,这个任务的关键就是机器人想到了如何使用L型的木块把圆柱体钩过来。

以及,即便只给机器人提供矿泉水瓶之类的日常物体,它也能推理出如何把它作为工具完成任务。

最后,在最好不使用工具的环境中,机器人也会选择直接用自己的夹钳完成任务。

左:任务目标是把两个物体都移向左边,机器人选择用工具高效地完成;右:任务目标只需移动一个物体,机器人用自己的夹钳把它移过去

除了这些例子之外,论文中的量化实验结果表明他们的方法比单独使用从演示学习有更好的泛化通用性,也比单独从经验学习有更强的完成任务能力。

关于其他机器人使用工具研究的对比讨论

论文《A Relational Approach to Tool-Use Learning in Robots》研究了如何在任务和运动规划框架下通过逻辑编程和已知模型控制工具。然而,基于逻辑的系统和基于解析模型的系统都容易受到建模误差的影响,这会在测试执行时累积并影响表现。

其它的研究中把工具看作了面向任务的抓取动作控制,并根据规划或者策略学习来使用工具。这些方法都限制了涉及到工具的运用的范围,而这篇论文中的方法不论场景中有没有工具都可以完成运动规划。

也有一些别的方法(1,2)提出在使用工具中学习动态模型。然而,这些方法需要额外使用手工设计的感知流水线,或者完全忽略感知,这篇论文中的方法就可以直接从原始图像像素中学习物体间的交互。

结论

会出现从未见过的物体的多样、复杂任务是机器人领域正在尝试攻克的问题。为了研究这个问题,这篇论文的作者们研究了需要把物体作为工具的多种任务。作者们提出了结合模仿学习和自我监督交互学习的新方法,并展示了这种方法可以让机器人完成复杂的多物体交互任务,其中可以含有多种多样的物体,甚至可以在新的环境中灵活运用物体作为工具。作者们希望这项研究展示了让机器人同时变得更通用和更能干的新方法,以便未来机器人可以在日常生活环境中执行有用的任务。

论文原文:

《ImprovisationthroughPhysicalUnderstanding:UsingNovelObjectsasToolswithVisualForesight》

论文地址:https://arxiv.org/abs/1904.05538

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器人
    +关注

    关注

    211

    文章

    28405

    浏览量

    207017
  • UC
    UC
    +关注

    关注

    1

    文章

    57

    浏览量

    60951
收藏 人收藏

    评论

    相关推荐

    新型复眼结构有望革新机器人视觉系统

    的灵敏度较现有市售产品高出两倍以上。这一突破有望革新机器人视觉系统、增强机器人的导航、感知和决策能力,并为人机协作开拓了更广泛的商业应用和未来发展空间。     研究团队(香港科技大学) 该创新系统模仿生物复眼的视觉
    的头像 发表于 12-24 10:49 152次阅读
    新型复眼结构有望革<b class='flag-5'>新机器人</b>视觉系统

    鸿蒙机器人与鸿蒙开发板联动演示

    鸿蒙机器人与鸿蒙开发板联动演示,机器人的角色为迎宾机器人,开发板负责人宾客出现监听
    发表于 12-02 14:55

    软硬互联——革新机器人非标产线智能制造

    在智能制造的浪潮中,每一条生产线都承载着企业向智能化、高效化转型的梦想。特别是对于机器人非标产线而言,如何在复杂多变的生产任务中保持高效、灵活与智能化,成为了众多制造企业关注的焦点。今天,就让我们一同探索IO模块、网关与物联网平台如何协同作战,在
    的头像 发表于 11-13 16:44 166次阅读
    软硬互联——革<b class='flag-5'>新机器人</b>非标产线智能制造

    小鹏汽车正式进军人形机器人领域,发布AI机器人Iron

    在特斯拉之后,中国电动汽车制造商小鹏汽车也于11月6日正式进军人形机器人领域。今日下午,小鹏汽车在广州隆重发布了其自主研发的全新AI人形机器人——Iron。   Iron机器人是按照真人1:1
    的头像 发表于 11-07 15:28 620次阅读

    “0元购”智元灵犀X1机器人,软硬件全套图纸和代码全公开!资料免费下载!

    自由度设计展现了灵活的运动能力;安全轻量及高可扩展性,更加适用于人机交互与轻服务场景。在智元灵犀X1打造过程中,智元机器人创新性地应用了自研的PowerFlow R86、R52两款关节电机,依托模块化
    发表于 10-25 15:20

    医疗机器人有哪些_医疗机器人有哪些应用

    医疗机器人是医用机器人工程的重要应用,结合了各个学科最新研究和发展的成果,并广泛应用于医学诊疗、康复等医学领域。医疗机器人的类型多种多样,以下是主要的一些类型:
    的头像 发表于 10-21 15:16 780次阅读

    NVIDIA在ICRA展示最新机器人研究

    在 日前举行的 IEEE 国际机器人和自动化大会(ICRA)上,几何织物(geometric fabrics)成为一个热门的讨论话题。几何织物是 NVIDIA 机器人研究实验室成员与合作者共同提交的七篇论文的主题之一,并于 ICRA 上发表。
    的头像 发表于 10-10 09:55 357次阅读

    构建语音控制机器人 - 深入研究威廉希尔官方网站

    2024-07-29 |Annabel Ng S1XT33N项目 正如[之前的博客文章]中提到的,加州大学伯克利分校的 EECS 16B 课程重点关注构建名为 S1XT33N 的语音控制机器人的为期
    的头像 发表于 10-02 16:40 235次阅读
    构建语音控制<b class='flag-5'>机器人</b> - 深入研究威廉希尔官方网站

    Al大模型机器人

    丰富的知识储备。它们可以涵盖各种领域的知识,并能够回答相关问题。灵活性与通用性: AI大模型机器人具有很强的灵活性和通用性,能够处理各种类型的任务和问题。持续学习和改进: 这些模型可以通过持续的训练
    发表于 07-05 08:52

    基于FPGA EtherCAT的六自由机器人视觉伺服控制设计

    和增强系统处理图像的实时性,本文提出了一种伊瑟特的六自由机器人视觉伺服控制系统,将摄像头集成到基于 Zynq的伊瑟特主站上,提高了视觉伺服的实时性.经测试,该平台能够对视觉检测目标的变化做出及时的反应
    发表于 05-29 16:17

    大象机器人完成Pre-B轮融资,致力打造全新机器人生态!

    近日,深圳市大象机器人科技有限公司(以下简称「大象机器人」)近日完成Pre-B轮融资,本轮融资由清辉投资领投、云卓资本跟投,资金将用于人形机器人产线升级及持续研发迭代。义柏资本担任长期独家财务顾问。
    的头像 发表于 05-22 14:46 905次阅读

    斯坦福、伯克利大神教授创业给机器人造大脑,OpenAI红杉抢着投5亿

    还记得曾火遍全网的ALOHA家务机器人吗?最近该项目导师,斯坦福计算机科学与电气工程系教授ChelseaFinn在X宣布,正式与其他几位伯克利大牛学者、谷歌DeepMind科学家共同创业,全力为
    的头像 发表于 04-14 08:04 135次阅读
    斯坦福、<b class='flag-5'>伯克利</b>大神教授创业给<b class='flag-5'>机器人</b>造大脑,OpenAI红杉抢着投5亿

    机器人焊接与人工焊接对比分析

    。本文创想焊缝跟踪器小编将对这两种焊接方式进行对比分析。 一、成本 在成本方面,机器人焊接需要较大的初期投入。机器人本身的购置费用以及安装、调试等费用都相当可观。此外,维护和更新机器人所需的费用也不容忽视。相比
    的头像 发表于 04-11 14:30 543次阅读
    <b class='flag-5'>机器人</b>焊接与人工焊接对比分析

    常见的多关节机器人有哪些?具有什么特点?

    系统 多关节机器人具有以下一些特点: 灵活性:多关节机器人由多个可动关节构成,能够实现复杂的运动和姿态调整,适应不同的工作环境和任务需求。 自由度高:多关节
    的头像 发表于 03-07 08:42 1467次阅读
    常见的多关节<b class='flag-5'>机器人</b>有哪些?具有什么特点?

    2024年工智能在职场发展的五大趋势

    首先,许多为残疾工作者开发的机器学习工具可能会越来越普及,这是美国加州大学伯克利分校包容城市实验室主任 Victor Santiago Pineda 的看法。例如,基于算法的语音转文字和文字转语音
    的头像 发表于 01-09 16:50 794次阅读