在浩瀚的历史长河中,古籍作为中华民族的文化瑰宝,承载着无数先人的智慧与心血。然而,由于岁月侵蚀、保存不当等多种原因,许多珍贵的古籍面临损坏、失传的危机。为了守护这些无价之宝,云聪研发团队倾力打造了一款尖端的OCR(光学字符识别)系统,旨在提升古籍数字化校编的效率,让千年文化得以传承。
在研发这款OCR系统的过程中,云聪博士团队深知每一份古籍的珍贵与独特性。他们克服了技术上的种种挑战,力求在确保准确识别的同时,最大化地保留古籍的原貌和独特风格。正是这份执着与坚守,让云聪OCR系统在业界脱颖而出,成为古籍数字化校编领域的翘楚。
本模块支持私有化部署,API调用。
一、技术核心
1、识别核心
OCR精校工厂内置云聪科技最新研发的高性能文字识别引擎,其中《国标GB2312 汉字编码字符集》常用汉字6,763个,平均识别率达99.9%以上,《国标GB18030-2000中文编码字符集》繁体异体汉字27,533个,中文汉字平均识别率达95%以上。另外多语言版本英文、日文、韩文的识别率居国内主流水平。

2、逐字横排校对
云聪OCR精校工厂支持将竖版繁体文字转换为横版繁体文字,单个文字上下一对一进行逐字校对,支持全程快捷键键盘操作,符合现在的阅读习惯,大大提高校对效率。

3、复杂版面分析
云聪OCR精校工厂的内置复杂版面识别引擎,凭借其卓越的AI技术,对上下栏古籍、批注栏、竖版报纸以及简体中文报纸等各


524

被折叠的 条评论
为什么被折叠?



