解决TensorRT does not natively support INT64的问题记录

当使用PyTorch导出的ONNX模型在TensorRT中遇到INT64权重不支持的问题时,可通过降低ONNX及PyTorch版本至1.6.0和1.4.0来解决。确保TensorRT版本兼容,并使用onnx-simplifier简化模型。
Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化,内置完整运行环境与 Qwen3-32B 模型依赖,开箱即用。

问题描述

在对使用PyTorch导出的onnx模型进行TensorRT解析时出现:Your ONNX model has been generated with INT64 weights, while TensorRT does not natively support INT64. Attempting to cast down to INT32.的错误。

解决方法

在网上有找到解决方案把onnx模型转TensorRT模型的trt模型报错,但由于机器上安装的onnx版本是1.8.0,pytorch版本是1.7.1,推测版本太高导致onnx-simplifier无法转换成功。查看后发现TensorRT-7.1.3.4支持的onnx版本是1.6.0,在降低onnx版本为1.6.0,pytorch版本为1.4.0后,使用TensorRT-7.1.3.4可正常通过模型的转换和解析。

pip install onnx-simplifier
python -m onnxsim your_model.onnx your_model_sim.onnx

您可能感兴趣的与本文相关的镜像

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen3-32B-Chat 私有部署镜像 | RTX4090D 24G 显存 CUDA12.4 优化版

Qwen
文本生成
Qwen3

本镜像基于 RTX 4090D 24GB 显存 + CUDA 12.4 + 驱动 550.90.07 深度优化,内置完整运行环境与 Qwen3-32B 模型依赖,开箱即用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值