详情介绍
tesseract ocr是一款由惠普开发的图像识别类库,后面成为Open source,据说曾经的图像识别能力排名第三,为大家提供的版本是3.02.02 for windows,喜欢的朋友欢迎前来下载使用。
Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。 数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生--2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。 Tesseract目前已作为开源项目发布在Google Project,其项目主页在这里查看,其最新版本3.0已经支持中文OCR,并提供了一个命令行工具。
使用方法
下载完后进行安装,默认情况下安装程序会给你配置系统环境变量,以指向安装目录(之后可以通过DOS界面在任意目录运行tesseract)。安装完成后目录如下:
附录:
tessdata 目录存放的是语言字库文件,和在命令行界面中可能用到的参数所对应的文件. 这个安装程序默认包含了英文字库。
使用Tessract-OCR引擎识别验证码
打开DOS界面,输入tesseract:
如果出现如上输出,表示安装正常。
我准备了一张验证码放在D盘根目录下,上图:
结果为:
附录:
Usage:tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
pagesegmode values are:
0 = Orientation and script detection (OSD) only.
1 = Automatic page segmentation with OSD.
2 = Automatic page segmentation, but no OSD, or OCR
3 = Fully automatic page segmentation, but no OSD. (Default)
4 = Assume a single column of text of variable sizes.
5 = Assume a single uniform block of vertically aligned text.
6 = Assume a single uniform block of text.
7 = Treat the image as a single text line.
8 = Treat the image as a single word.
9 = Treat the image as a single word in a circle.
10 = Treat the image as a single character.
-l lang and/or -psm pagesegmode must occur before anyconfigfile.
tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
tesseract 图片名 输出文件名 -l 字库文件 -psm pagesegmode 配置文件
例如:
tesseract code.jpg result -l chi_sim -psm 7 nobatch
-l chi_sim 表示用简体中文字库(需要下载中文字库文件,解压后,存放到tessdata目录下去,字库文件扩展名为 .raineddata 简体中文字库文件名为: chi_sim.traineddata)
-psm 7 表示告诉tesseract code.jpg图片是一行文本 这个参数可以减少识别错误率. 默认为 3
configfile 参数值为tessdata\configs 和 tessdata\tessconfigs 目录下的文件名
下载地址
人气软件
绿色单文件封装工具 3.2.3.9 中文免费绿色版
jprofiler(Java性能分析工具) v9.2.1 64位 官方免费版(附注册码)
脚本安装系统 Nullsoft Scriptable Install System V2.45 英文
Indigo Rose Setup Factory(安装程序制作工具) v9.5.2.0 安装特
Inno Setup 5.4.0 D8团队版(Inno增强版)
aapt.exe(apk分析工具) 附aapt.exe已停止工作的解决方法
NSIS自定义界面设计(NSIS Dialog Designer) v1.4.0 英文免费安装
软件去弹窗工具 v1.3 绿色版
联想Utility和Vantage独立安装工具 V1.2.21.428 官方绿色版
Advanced BAT to EXE Converter (将bat转exe的工具) V2.62免费版
相关文章
- excel中如何给表格添加背景? 给Excel表格加背景图的教程
excel表格想要插入背景图片,哦们直接的点击打开方式下的页面布局,然后找到背景选项来进行操作就可以了,详细请看下文介绍...
- word页码10以上显示1怎么办? word页码十几显示1的解决办法
在使用word文档时发现,设定好的页码9后面本应是10,却变成了1,下面我们就来解决word页码到10页为啥回到1了的解决办法...
- 谷歌浏览器点击书签怎么打开新标签页? chrome新标签页打开设置技巧
谷歌浏览器每次点击标签打开的都是上次浏览器的页面,想要打开新的标签页,该怎么设置呢?下面我们就来看看详细的教程...
- 火狐浏览器下载文件没反应怎么办? Firefox下载文件失败的解决办法
火狐浏览器下载文件的时候有时候会提示我们下载失败,那么这要怎么办?用户们可以点击设置选项下的隐私与安全选项通过设置解决这个问题...
- WPS如何将大标题都改成章节标题 WPS将所有大标题都改成章节标题的方法
WPS如何将大标题都改成章节标题?我们需要将已经设置的大标题内容进行选中,之后就可以进入到自定义章节标题的窗口中进行选择自己需要的一个章节标题类型进行添加了...
- WPS表格内容如何进行笔画排序 WPS表格内容进行笔画排序的方法
WPS表格内容如何进行笔画排序?我们可以进入到排序的窗口中,可以设置主要关键词或者是次要关键词进行拼音、数字、日期以及笔画等排序,并且可以选择升序或降序排序...
下载声明
☉ 解压密码:www.jb51.net 就是本站主域名,希望大家看清楚,[ 分享码的获取方法 ]可以参考这篇文章
☉ 推荐使用 [ 迅雷 ] 下载,使用 [ WinRAR v5 ] 以上版本解压本站软件。
☉ 如果这个软件总是不能下载的请在评论中留言,我们会尽快修复,谢谢!
☉ 下载本站资源,如果服务器暂不能下载请过一段时间重试!或者多试试几个下载地址
☉ 如果遇到什么问题,请评论留言,我们定会解决问题,谢谢大家支持!
☉ 本站提供的一些商业软件是供学习研究之用,如用于商业用途,请购买正版。
☉ 本站提供的tesseract ocr(图像识别类库) v4.0.0.20181030 官方安装免费版资源来源互联网,版权归该下载资源的合法拥有者所有。