前言
ONNX Runtime是适用于Linux,Windows和Mac上ONNX格式的机器学习模型的高性能推理引擎,但在arm服务器上,onnxruntime只有CPU版的,GPU版的没有,因此需要自行去编译GPU版本的才可以。
环境准备
1、python3.8
2、cmake:2.26.0版本以上,可以直接下载aarch64版本的进行安装Releases · Kitware/CMake (github.com)

3、gcc:需要9.2版本以下,可以查看该篇文章进行编译【centos7 arm服务器编译安装gcc 9.2】
4、onnxruntime源码:
本文介绍了如何在CentOS7的ARM服务器上编译安装ONNXRuntime的GPU版本。由于官方仅提供CPU版,因此需要自行编译。编译前需准备Python3.8、CMake 2.26.0+、GCC 9.2以下版本。编译过程包括安装CUDA和CuDNN,然后下载ONNXRuntime源码并进行编译。最终编译完成的文件位于./build/Linux/Release/dist/目录下。
订阅专栏 解锁全文

5063

被折叠的 条评论
为什么被折叠?



