首先我先讲下为什么要基于官方提供的训练模型进行训练:
(1)基于基础算法模型库的训练模型,需要自己基于很多数据进行训练才能得到一个好的效果,如果数据量少了就会出现预测效果不好的情况。
(2)PaddleOCR提供的训练模型和预训练模型已经是基于一定的数据量训练出来的模型。训练模型是基于预训练模型在真实数据与竖排合成文本数据上finetune得到的模型,在真实应用场景中有着更好的表现,预训练模型则是直接基于全量真实数据与合成数据训练得到,更适合用于在自己的数据集上finetune。
一、基于PaddleOCR提供的文本检测模型进行预测效果演示
1、下载文本检测模型

我下载的是ch_ppocr_server_v1.1.det
2、解压到./pretrain_models
sudo tar -xf ch_ppocr_server_v1.1_det_train.tar
3、测试预测效果
sudo python tools/infer_det.py -c configs/det_det_r18_vd_db_v1.1.yml -o TestReader.infer
本文档介绍了如何基于PaddleOCR的预训练模型进行文本检测的预测及训练。首先展示了使用官方模型进行预测的效果,然后详细阐述了下载模型、解压及测试过程。在训练部分,作者提到PaddleOCR的模型已在大量数据上预训练,适用于实际场景。通过在icdar2015数据集上的训练,讨论了训练中可能遇到的问题和解决方案。
订阅专栏 解锁全文

1万+

被折叠的 条评论
为什么被折叠?



