基于YOLOv8与LPRNet的实时车牌检测与识别系统优化实践

最新推荐文章于 2026-06-24 10:23:40 发布

原创

最新推荐文章于 2026-06-24 10:23:40 发布 · 394 阅读

标签

#车牌识别系统 #YOLOv8 #LPRNet #深度学习

1. 为什么选择YOLOv8+LPRNet？一个更聪明的组合

大家好，我是老张，在AI和智能硬件这块摸爬滚打了十来年，做过不少车牌识别的项目。从最早的传统图像处理，到后来用上各种深度学习模型，踩过的坑不少，也积累了一些实战心得。今天想和大家聊聊，在当下这个节点，为什么我认为 YOLOv8 和 LPRNet 的组合，是构建一个高效、实用的实时车牌识别系统的一个非常聪明的选择。

你可能听说过很多方案，比如用YOLOv5做检测，再用一个CRNN或者别的什么网络做识别。这些方案当然也能用，但在实际部署，尤其是面对复杂交通场景时，往往会遇到一些瓶颈。比如，检测速度跟不上，或者识别模型太笨重，在边缘设备上跑起来像“老牛拉车”。YOLOv8和LPRNet的组合，恰恰是针对这些痛点来的。

简单来说，YOLOv8负责“找”，它就像一个眼神特别好的哨兵，能在视频流里飞快地、准确地定位出车牌在哪里。而 LPRNet负责“认”，它像一个经验丰富的验票员，只看车牌那块区域，就能快速念出上面的字符。这个分工协作的流程，听起来简单，但里面的门道可不少。YOLOv8相比前几代，在保持高速度的同时，精度又上了一个台阶，特别是对小目标（比如远处的小车牌）的检测能力更强了。LPRNet呢，它是一个专门为车牌识别设计的端到端网络，最大的好处就是不用单独做字符分割。传统方法需要先把车牌上的每个字符切出来，再一个个去识别，这个过程很容易因为光照、污损、倾斜而出错。LPRNet直接输入整张车牌图片，输出就是字符序列，省事又鲁棒。

我去年在一个智慧停车场的项目里，把原来的两阶段方案换成了这个组合。实测下来，在同样的硬件上，处理速度从平均每帧150毫秒降到了80毫秒以内，而且对傍晚逆光、车牌带点泥巴这种“疑难杂症”的识别率，从不到80%提升到了95%以上。老板看了直说“稳”。所以，如果你正在为车牌识别系统的性能发愁，或者想从头搭建一个高性价比的方案，那这套组合拳绝对值得你深入研究一下。

2. 环境搭建与数据准备：磨刀不误砍柴工

动手之前，先把“厨房”收拾好。环境配置和数据准备是基础，这一步做扎实了，后面训练和优化会顺利很多。我习惯用Anaconda来管理Python环境，能有效避免各种包版本冲突的“玄学”问题。

2.1 创建并配置Python环境

首先，我们创建一个独立的Python环境，这里以Python 3.9为例，因为它和主流深度学习框架的兼容性比较好。

conda create -n license_plate python=3.9 -y
conda activate license_plate

接下来安装核心的深度学习框架。PyTorch是必须的，去官网根据你的CUDA版本选择安装命令。如果你没有GPU，就用CPU版本，但训练速度会慢很多。这里假设你有CUDA 11.8：

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

然后安装YOLOv8的官方库ultralytics，以及一些数据处理和可视化的帮手：

pip install ultralytics opencv-python pillow matplotlib pandas scikit-learn

对于LPRNet，它通常不直接有个pip install就能装的包，我们需要从GitHub上把源码拉下来。这里我推荐一个比较稳定且功能齐全的复现版本：

git clone https://github.com/某个高质量的LPRNet复现仓库.git
cd LPRNet
pip install -r requirements.txt

注意，你可能需要根据实际情况调整仓库地址。安装时如果遇到问题，大概率是某些依赖的版本不对，耐心点，根据报错信息去搜一下，通常都能解决。

2.2 准备你的“教材”：数据集处理

模型学得好不好，七分看数据。车牌识别需要两类数据：一是用于训练YOLOv8的车牌检测数据集（图片+标注框），二是用于训练LPRNet的车牌字符识别数据集（裁剪出的车牌图片+对应的车牌号文本）。

对于检测数据，你可以使用公开数据集如CCPD（中国车牌数据集），它包含了各种天气、光照、角度的车牌图片，标注也很齐全。下载后，你需要将它的标注格式（通常是.json）转换成YOLOv8需要的.txt格式（每行：类别id、中心点x、中心点y、宽度w、高度h，所有坐标都是归一化后的值）。我写过一个简单的转换脚本：

import json
import os

def convert_ccpd_to_yolo(json_path, txt_save_dir):
    with open(json_path, 'r') as f:
        data = json.load(f)
    for img_info in data['images']:
        img_id = img_info['id']
        img_width = img_info['width']
        img_height = img_info['height']
        txt_path = os.path.join(txt_save_dir, f"{img_info['file_name'].replace('.jpg', '.txt')}")
        annotations = [ann for ann in data['annotations'] if ann['image_id'] == img_id]
        with open(txt_path, 'w') as f_txt:
            for ann in annotations:
                # CCPD的bbox格式是[x_min, y_min, width, height]
                x_min, y_min, w, h = ann['bbox']
                x_center = (x_min + w / 2) / img_width
                y_center = (y_min + h / 2) / img_height
                w_norm = w / img_width
                h_norm = h / img_height
                # 假设类别'license_plate'的id是0
                f_txt.write(f"0 {x_center:.6f} {y_center:.6f} {w_norm:.6f} {h_norm:.6f}\n")

对于识别数据，你需要从检测数据集中把车牌区域裁剪出来，并确保每个裁剪图对应一个正确的车牌号标签文件。LPRNet通常需要一个train.txt和val.txt，里面每行是“图片路径车牌号”的格式，例如：

./plate_images/001.jpg 京A12345
./plate_images/002.jpg 粤B88888

这里有个关键点：

最低0.47元/天解锁文章