四足机器人isaac gym强化学习训练示例

原创

已于 2025-04-28 13:07:12 修改 · 2.4k 阅读

·

10

·

标签

#机器人

于 2025-02-26 13:42:40 首次发布

参考Github调测整理：GitHub - Eriwdz/quadruped_isaacgym-: "Open-source code for 'Model-free End-to-end Learning of Agile Quadrupedal Locomotion', focusing on a simple yet effective reinforcement learning approach for quadruped robots to traverse complex terrains using proprioceptive feedback."

Isaac Gym Preview 3安装

从网站下载 Isaac Gym Preview 3 版本，然后按照文档中的安装说明进行作。我们强烈建议使用 conda 环境以简化设置。

通过运行目录中的示例之一（如 .按照 Isaac Gym Preview 3 中描述的故障排除步骤进行作安装说明（如果您在运行示例时遇到任何问题）。python/examplesjoint_monkey.py

安装 Isaac Gym 并且示例在您当前的 python 环境中工作后，请安装此存储库：

pip install -e .

运行基准测试

要训练您的第一个策略，请运行以下行：

python train.py task=Cartpole

Cartpole 应该训练到机器人在启动后的几秒钟内保持直立的程度。

这是另一个例子 - Ant locomotion：

python train.py task=A1

请注意，默认情况下，我们会显示一个预览窗口，这通常会减慢训练速度。你可以在运行时使用vv该键来禁用查看器更新并允许训练继续更快。再次按下该键可继续查看训练几秒钟后，一旦Ant已经学会了跑得更好一些。

使用 esc键或关闭查看器窗口以提前停止训练。

或者，您也可以进行headless训练，如下所示：

python train.py task=Ant headless=True

Ant 可能需要一两分钟来训练您可以运行的策略。以 Headless 方式运行时，您可以在命令行窗口中使用 Control-C 提前停止它。

加载预训练模型

检查点保存在默认为任务名称的文件夹中，但也可以通过参数覆盖。

runs/EXPERIMENT_NAME/nnEXPERIMENT_NAMEexperiment

要加载经过训练的检查点并继续训练，请使用以下参数：checkpoint

python train.py task=Ant checkpoint=runs/A1/nn/A1.pth

要加载经过训练的检查点并仅执行推理（无训练），请作为参数以及检查点名称传递。为避免渲染开销，您可以还希望使用：test=Truenum_envs=64

python train.py task=Ant checkpoint=runs/Ant/nn/Ant.pth test=True num_envs=64

请注意，如果 checkpoint 名称中有特殊字符，例如或你需要对它们进行转义，并在字符串两边加上引号。例如[=checkpoint="./runs/A1/nn/last_A1ep\=

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。