目录
3.1.1.1 HuggingFace 模型下载(自动缓存)
3.1.1.3 多GPU加载策略(CUDA_VISIBLE_DEVICES)
3.1.3.1 离线数据集评估脚本(eval_policy.py)
3.1.3.2 预测 vs 真值可视化(MSE 计算与动作曲线绘制)
3.2.1.1 服务端模式启动(run_gr00t_server.py --server)
3.2.1.2 端口与主机配置(--policy_port=5555 默认)
3.2.2.1 客户端模式连接(eval_so100.py 示例)
3.2.2.2 实时观测数据打包(图像编码 + 状态向量序列化)
3.2.2.3 语言指令动态注入(--lang_instruction)
3.2.3.1 TensorRT 引擎构建(ONNX 导出 → trtexec 编译)
3.2.3.2 FP16 量化配置(推理速度提升 2-3 倍,精度损失 <1%)
3.2.3.3 Jetson Thor 性能基准(示例数据)
3.3.1.3 多视图融合策略(单视图 vs 立体视觉延迟对比)
3.3.2.1 GPU SM 利用率检查(nvidia-smi dmon)
3.3.2.2 内存泄漏排查(PyTorch 显存快照分析)
4.1.1.1 训练配置参数(max-steps=2000, global-batch-size=32)
4.1.1.3 显存优化技巧(gradient checkpointing与--no-tune_diffusion_model)
4.1.2.1 LoRA rank与alpha配置(--lora_rank 64 --lora_alpha 128)
4.1.2.2 可训练参数筛选(仅训练adapter与action head)
4.1.2.3 多卡并行训练(2×A6000/RTX 4090配置)
4.1.3.1 多数据集联合训练(--dataset-path
4.1.3.2 数据集权重平衡(balance_dataset_weights=True)
4.1.3.3 预训练数据混合(与真实数据1:1比例防止过拟合)
4.2.1.1 颜色抖动参数(brightness 0.3, contrast 0.4, saturation 0.5)
4.2.1.2 图像空间增强(随机裁剪、水平翻转、高斯噪声)
4.2.3.1 DAgger数据收集流程(模型犯错时人工纠正)
4.3.1.1 高精度抓取微调(Lightwheel AI汽车工厂案例)
4.3.1.2 双臂协调操作(bimanual manipulation配置)
4.3.2.1 开放世界泛化(1X Technologies NEO Gamma案例)
4.3.3.1 全身控制策略(Unitree G1 23/29自由度适配)
4.3.3.2 实时轨迹修正(RTC技术train-time与test-time应用)
5.1.1.1 串口通信协议(SO-101: /dev/ttyACM0波特率配置)
5.1.1.2 以太网/ZMQ远程控制(WiFi桥接延迟优化)
5.1.1.3 ROS2集成(话题订阅/发布与GR00T策略桥接)
5.1.2.1 相机驱动配置(OpenCV索引与分辨率设置)
5.1.2.3 触觉传感器接入(GelSight等高频数据流)
5.1.3.2 软件安全监控(关节限位、速度阈值、碰撞检测)
5.1.3.3 人机协作安全标准(ISO/TS 15066合规)
5.2.3.2 热管理与性能衰减监控(Jetson Orin温度阈值)
5.3.1.1 语言指令跟随失败(检查annotation字段与VLM冻结状态)
5.3.1.2 动作抖动与不平滑(相对动作vs绝对动作选择)
5.3.1.3 泛化能力不足(DAgger数据收集与域随机化增强)
5.3.3.2 多进程资源竞争(GIL与CUDA上下文管理)
6.1.1.3 任务切换开销优化(零样本任务切换延迟<100ms)
6.3.1.1 云端训练-边缘推理 pipeline(模型压缩与量化)
6.3.2.1 多机器人数据收集 orchestration(Mega Blueprint应用)
3.1 基础推理流程
3.1.1 预训练模型加载
3.1.1.1 HuggingFace 模型下载(自动缓存)
说明:优先使用 transformers 的 from_pretrained(会自动缓存到 ~/.cache/huggingface/hu
订阅专栏 解锁全文

1万+

被折叠的 条评论
为什么被折叠?



