做外贸的阿里巴巴网站是哪个,门户网站建设采购,wordpress 图文排版,如何做自己的网站后台转自#xff1a;https://blog.csdn.net/a745233700/article/details/80203340javajava调用tess4j识别图像文字Tesseract-OCR支持中文识别#xff0c;而且开源和提供全套的训练工具#xff0c;是快速低成本开发的首选。前面记录过在java中调用tesseract-orc#xff0c;该方法…转自https://blog.csdn.net/a745233700/article/details/80203340javajava调用tess4j识别图像文字Tesseract-OCR支持中文识别而且开源和提供全套的训练工具是快速低成本开发的首选。前面记录过在java中调用tesseract-orc该方法的原理是经过在java中调用cmd命令行来执行tesseract可是该方式须要下载软件在电脑上安装环境移植性不高。git而Tess4J则是Tesseract在Java PC上的应用。若是使用Tess4J只须要下载相关Jar包导入项目再把项目封装好就能够到处运行了可移植性比较好。Tess4J在英文和数字识别中性能比较好可是在中文识别中不管速度仍是识别率仍是较弱所以须要针对场景进行训练才能得到较好结果。github这篇博客简单记录一下在java中经过调用tess4j的方式识别图片的文字内容。maven步骤工具(1)下载tess4j源码包https://sourceforge.net/projects/tess4j/性能tessdata下默认为英语库中文库下载地址https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata测试其余库的下载地址https://github.com/tesseract-ocr/tessdataui下载完的tess4j资源包目录以下.net(2)新建一个java工程命令行使用Build Path - configure build path导入dist目录下的tess4j.jar 和 lib目录下的全部jar包以下图若是是maven工程则导入如下maven依赖。net.sourceforge.tess4jtess4j3.2.1(3)把tessdata文件夹复制到项目的根目录下(与src目录同级)以下图若是tessdata目录没有配置到根目录下就须要在代码中指定datePath。(4)编写测试类import java.io.File;import net.sourceforge.tess4j.ITesseract;import net.sourceforge.tess4j.Tesseract;import net.sourceforge.tess4j.TesseractException;/*** 类说明 tess4j测试类*/public class OCRDemo {public static void main(String[] args) throws TesseractException {ITesseract instance new Tesseract();//若是未将tessdata放在根目录下须要指定绝对路径//instance.setDatapath(the absolute path of tessdata);//若是须要识别英文以外的语种须要指定识别语种而且须要将对应的语言包放进项目中instance.setLanguage(chi_sim);// 指定识别图片File imgDir new File(C://Users//1_20180208150251_x4hzz//1.png);long startTime System.currentTimeMillis();String ocrResult instance.doOCR(imgDir);// 输出识别结果System.out.println(OCR Result: \n ocrResult \n 耗时 (System.currentTimeMillis() - startTime) ms);}}(5)图片素材与识别结果能够看到tess4j在中文识别时不管速度仍是识别率仍是较弱须要针对场景进行训练才能得到较好结果。---------------------做者a745233700来源CSDN原文https://blog.csdn.net/a745233700/article/details/80203340版权声明本文为博主原创文章转载请附上博文连接