如何训练机器人学习新技能-电子发烧友网

10月27日消息，据外媒报道，约翰斯霍普金斯大学博士生安德鲁洪特（Andrew Hundt）近日发布一篇新论文，指出应通过正强化法训练机器人学习新技能。

这篇论文的核心思想是，在训练机器人的过程中，应采用正强化法，即相比于在它做错时进行惩罚，更应在它做对时进行激励。而对于机器人来说，这种激励机制是以评分系统的形式呈现的，类似玩游戏一样，根据执行任务的情况获得积分。

安德鲁表示，这种方法能够大大缩短训练机器人执行任务的时间。“机器人希望能得到更高的分数，所以它们很快就可以完成相关任务。过去机器人需要一个月的练习才能达到100%的准确性，现在只用两天就能做到。”

不过他也指出，目前机器人执行的这些任务仍然是比较初级的，比如堆积木。但在未来，机器人有望通过正强化法完成更复杂和有意义的任务。
责任编辑：YYX

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器人

机器人

+关注

关注
211

文章
28418

浏览量
207082

【「具身智能机器人系统」阅读体验】1.全书概览与第一章学习

非常感谢电子发烧友提供的这次书籍测评活动！最近，我一直在学习大模型和人工智能的相关知识，深刻体会到机器人技术是一个极具潜力的未来方向，甚至可以说是推动时代变革的重要力量。能参与这次活动并有机会深入

发表于 12-27 14:50

《具身智能机器人系统》第7-9章阅读心得之具身智能机器人与大模型

和经验积累，使机器人能够自主发现工艺规律，优化作业参数。家庭服务机器人则采用混合任务规划策略：将预训练的基础技能与实时规划相结合，灵活应对开放环境中的各种情况。第9章深入探讨了元

发表于 12-24 15:03

【「具身智能机器人系统」阅读体验】+数据在具身人工智能中的价值

100 倍。此外，Sim2Real 技术的进步也促进了技能与知识从模拟环境到实际应用的转移。这项技术在虚拟空间中训练机器人和 AI 系统，使它们能够安全有效地学习任务，而不受现实世

发表于 12-24 00:33

【「具身智能机器人系统」阅读体验】+初品的体验

动态互动的。该理论强调智能行为源于智能体的物理存在和行为能力，智能体必须具备感知环境并在其中执行任务的能力。具身智能的实现涵盖了机器学习、人工智能、机器人学、计算机视觉、自然语言处理及强化学

发表于 12-20 19:17

NVIDIA发布全新AI和仿真工具以及工作流

NVIDIA 在本周于德国慕尼黑举行的机器人学习大会（CoRL）上发布了全新 AI 和仿真工具以及工作流。机器人开发者可以使用这些工具和工作流，大大加快 AI 机器人（包括人形机器人）

发表于 11-09 11:52 •273次阅读

麻省理工学院推出新型机器人训练模型

近日，据TechCrunch报道，麻省理工学院的研究团队展示了一种创新的机器人训练模型，该模型突破了传统模仿学习方法的局限，不再依赖标准数据集，而是借鉴了大型语言模型（LLM）如GPT-4等所使用的大规模信息处理方式，为

发表于 11-04 14:56 •493次阅读

在NVIDIA Isaac Lab中训练四足机器人运动

由于涉及复杂的动力学，为四足机器人制定有效的运动策略是机器人领域面临的重大挑战。在现实世界中训练四足机器人上下楼梯可能会损坏设备和环境，因此，在学习

发表于 09-06 14:48 •563次阅读

机器人的三大矩阵是什么及关系式

在机器人学中，三大矩阵主要指的是与机器人位移、速度和力相关的矩阵，它们分别揭示了机器人在不同空间（如关节空间和作业空间）之间的映射关系。这三大矩阵及其关系式可以概括如下： 1. T矩阵（变换矩阵

发表于 09-04 09:37 •1434次阅读

预训练和迁移学习的区别和联系

预训练和迁移学习是深度学习和机器学习领域中的两个重要概念，它们在提高模型性能、减少训练时间和降低

发表于 07-11 10:12 •1060次阅读

如何理解机器学习中的训练集、验证集和测试集

理解机器学习中的训练集、验证集和测试集，是掌握机器学习核心概念和流程的重要一步。这三者不仅构成了模型学习

发表于 07-10 15:45 •3960次阅读

Al大模型机器人

丰富的知识储备。它们可以涵盖各种领域的知识，并能够回答相关问题。灵活性与通用性: AI大模型机器人具有很强的灵活性和通用性，能够处理各种类型的任务和问题。持续学习和改进: 这些模型可以通过持续的训练

发表于 07-05 08:52

NVIDIA Isaac 机器人平台利用最新的生成式 AI 和先进的仿真技术，加速 AI 机器人技术的发展

观众展示了用于人形机器人学习的通用基础模型 Project GR00T（代表通用机器人 00 技术）。Project GR00T 利用 NVIDIA Isaac 机器人平台的各种工具来创建用于人形

发表于 06-04 18:00 •7707次阅读

使用NVIDIA Isaac Manipulator生成抓取姿势和机器人运动

NVIDIA 宣布与 Intrinsic.ai 就工业机器人任务的基础技能模型学习展开合作。

发表于 05-17 10:33 •1296次阅读

NVIDIA Isaac机器人平台升级，加速AI机器人技术革新

NVIDIA Isaac机器人平台近期实现重大升级，通过引入最新的生成式AI技术和先进的仿真技术，显著加速了AI机器人技术的发展步伐。该平台正不断扩展其基础模型、机器人学习框架、AI工作流编排以及

发表于 03-27 10:36 •682次阅读

机器人学习中主流智能抓取方案

RGB颜色空间由红绿蓝三种基本色组成，叠加成任意色彩，同样地，任意一种颜色也可以拆解为三种基本色的组合，机器人通过颜色坐标值来理解“颜色”。

发表于 03-13 10:07 •303次阅读