参考:http://blog.csdn.net/lgzdlmu/article/details/7289430
语言包下载地址 :wget http://tesseract-ocr.googlecode.com/files/chi_sim.traineddata.gz
依赖库下载地址:http://leptonica.googlecode.com/files/leptonica-1.69.tar.gz
可惜失败效果不理想。在https://dynamic.12306.cn/otsweb/passCodeAction.do?rand=lrand 下载了两个验证码图片(数字和英文字母组合),均未万丈识别。
下一个目标:在vs2010中编译出tesseract 的dll,可参考:http://www.cnblogs.com/zsb517/archive/2012/06/03/2532488.html#commentform
http://tesseract-ocr.googlecode.com/svn/trunk/vs2008/doc/setup.html
本文详细介绍了如何在Visual Studio 2010中编译Tesseract OCR的DLL,以及通过下载特定依赖库来解决验证码识别问题。包括了从获取验证码图片到最终识别的完整流程。

1万+

被折叠的 条评论
为什么被折叠?



