四足机器人isaac gym强化学习训练示例

参考Github调测整理:GitHub - Eriwdz/quadruped_isaacgym-: "Open-source code for 'Model-free End-to-end Learning of Agile Quadrupedal Locomotion', focusing on a simple yet effective reinforcement learning approach for quadruped robots to traverse complex terrains using proprioceptive feedback."

Isaac Gym Preview 3安装

网站下载 Isaac Gym Preview 3 版本,然后 按照文档中的安装说明进行作。我们强烈建议使用 conda 环境 以简化设置。

通过运行目录中的示例之一(如 .按照 Isaac Gym Preview 3 中描述的故障排除步骤进行作 安装说明(如果您在运行示例时遇到任何问题)。python/examplesjoint_monkey.py

安装 Isaac Gym 并且示例在您当前的 python 环境中工作后,请安装此存储库:

pip install -e .

运行基准测试

要训练您的第一个策略,请运行以下行:

python train.py task=Cartpole

Cartpole 应该训练到机器人在启动后的几秒钟内保持直立的程度。

这是另一个例子 - Ant locomotion:

python train.py task=A1

请注意,默认情况下,我们会显示一个预览窗口,这通常会减慢训练速度。你 可以在运行时使用vv该键来禁用查看器更新并允许训练继续 更快。再次按下该键可继续查看训练几秒钟后,一旦Ant已经学会了跑得更好一些。

使用 esc键或关闭查看器窗口以提前停止训练。

或者,您也可以进行headless训练,如下所示:

python train.py task=Ant headless=True

Ant 可能需要一两分钟来训练您可以运行的策略。以 Headless 方式运行时,您 可以在命令行窗口中使用 Control-C 提前停止它。

加载预训练模型

检查点保存在默认为任务名称的文件夹中,但也可以通过参数覆盖。

runs/EXPERIMENT_NAME/nnEXPERIMENT_NAMEexperiment

要加载经过训练的检查点并继续训练,请使用以下参数:checkpoint

python train.py task=Ant checkpoint=runs/A1/nn/A1.pth

要加载经过训练的检查点并仅执行推理(无训练),请作为参数以及检查点名称传递。为避免渲染开销,您可以 还希望使用 :test=Truenum_envs=64

python train.py task=Ant checkpoint=runs/Ant/nn/Ant.pth test=True num_envs=64

请注意,如果 checkpoint 名称中有特殊字符,例如 或 你需要对它们进行转义,并在字符串两边加上引号。例如[=checkpoint="./runs/A1/nn/last_A1ep\=

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值