从训练到部署：YOLOv11模型在K230开发板上的完整落地实践

最新推荐文章于 2026-04-20 05:02:50 发布

原创

最新推荐文章于 2026-04-20 05:02:50 发布 · 520 阅读

标签

#YOLOv11 #K230 #模型部署 #嵌入式AI

1. 从训练到部署：一个端到端的实战故事

你好，我是老陈，一个在AI和嵌入式领域摸爬滚打了十多年的工程师。今天我们不聊那些高深莫测的理论，就聊聊怎么把一个你辛辛苦苦训练好的YOLOv11模型，实实在在地“塞”进一块K230开发板里，让它真正跑起来。很多朋友在训练模型时感觉自己是“炼丹大师”，一到部署环节就变成了“手忙脚乱的厨子”，面对各种格式转换、环境配置、工具链问题，头都大了。特别是K230这种带NPU（神经网络处理单元）的板子，性能潜力巨大，但部署流程也确实比纯CPU的板子多绕几个弯。

我理解你的处境：你可能在Windows上用YOLO框架训练出了一个精度不错的.pt模型文件，看着检测框画得挺准，满心欢喜。但接下来呢？怎么把这个“大家伙”变成能在资源有限的嵌入式设备上高效运行的“小精灵”？这个过程，就是从“炼丹房”走向“生产线”的关键一步。别担心，这篇文章就是为你准备的“操作手册”。我会手把手带你走一遍从Windows到Ubuntu，再从.pt到.kmodel，最后在K230上看到检测结果的完整流程。我会把我自己踩过的坑、总结的技巧都揉碎了讲给你听，目标是让你看完就能动手，动手就能成功。我们聚焦实战，命令、参数、报错信息，一个都不会少。

2. 第一步：在Windows上完成模型格式转换（PT -> ONNX）

模型训练通常在Windows或带GPU的Linux服务器上进行，我们拿到手的成果就是一个.pt文件。但K230的官方工具链nncase目前主要支持ONNX模型作为输入。所以，我们的第一站就是把PyTorch的.pt模型转换成ONNX格式。这个步骤在Windows上完成最方便。

为什么是ONNX？ 你可以把ONNX想象成一个“中间翻译官”。不同的深度学习框架（PyTorch, TensorFlow等）说的“方言”不一样，ONNX就是一种通用的“普通话”。先把PyTorch模型转换成ONNX，nncase这个“编译器”才能听懂，并进一步把它编译成K230 NPU能直接执行的机器码（.kmodel）。

转换的核心代码其实就几行，但里面的参数门道不少。我结合自己的经验，给你一个更稳妥、更详细的转换脚本：

# convert_pt_to_onnx.py
from ultralytics import YOLO

# 1. 加载你训练好的最佳模型
# 注意：路径最好用绝对路径，避免找不到文件的坑
model_path = r"D:\yolo_project\runs\detect\train11\weights\best.pt"
model = YOLO(model_path)

# 2. 执行导出，关键参数详解
success = model.export(
    format="onnx",           # 目标格式：ONNX
    imgsz=(320, 320),        # **重要**：必须与你训练和推理时的输入尺寸一致！
    # 对于K230，固定尺寸（如320x320）通常比动态尺寸性能更好，也更容易部署
    half=False,              # 是否使用FP16。K230 NPU支持INT8/FP16，但转换阶段建议先用FP32
    int8=False,              # **注意**：这里先不要开INT8量化！量化应在nncase阶段进行，这里导出FP32模型即可。
    dynamic=False,           # 关闭动态轴。固定batch、尺寸，简化模型结构，避免后续麻烦。
    simplify=True,           # 开启ONNX简化。这个必须开，能移除很多冗余算子，对后续编译至关重要。
    opset=12,                # 指定ONNX算子集版本。opset=12或13是比较稳定通用的选择。
    batch=1,                 # 批处理大小。嵌入式部署通常batch=1。
    nms=True,                # **关键**：是否将后处理NMS嵌入模型。建议设为True，让模型输出直接是框和分数，简化端侧代码。
    workspace=4,             # TensorRT相关，我们不用，但参数保留默认值即可。
    device='cpu',            # 导出时使

最低0.47元/天解锁文章