池州网站制作哪家好,深圳网页制作培训,百度做网站推广,wordpress 缩略图 剪裁 位置Java 读取TIFF JPEG GIF PNG PDF
本文解决方法基于开源 tesseract
下载适合自己系统版本的tesseract #xff0c;官网链接#xff1a;https://digi.bib.uni-mannheim.de/tesseract/ 2. 下载之后安装#xff0c;安装的时候选择选择语言包#xff0c;我选择了中文和英文 3.…Java 读取TIFF JPEG GIF PNG PDF
本文解决方法基于开源 tesseract
下载适合自己系统版本的tesseract 官网链接https://digi.bib.uni-mannheim.de/tesseract/ 2. 下载之后安装安装的时候选择选择语言包我选择了中文和英文 3. 如官网说明 Windows本机库是用Visual Studio构建的 需要依赖 Visual C 2015-2022 Redistributable Packages. 如果在window 上运行的话需要下载且安装。下载地址 https://learn.microsoft.com/en-US/cpp/windows/latest-supported-vc-redist?viewmsvc-170 选择下载合适的版本 不安装可能会报错 exception in thread main java.lang.unsatisfiedlinkerror: 找不到指定的模块。安装后需要重启电脑
写几行代码尝试读取图片中的文字 public static void main(String[] args) {Tesseract tesseract new Tesseract();// 读取中文tesseract.setLanguage(chi_sim);try {// 安装tessdata 的路径tesseract.setDatapath(D:\\Software\\tessdata);BufferedImage image ImageIO.read(new File(path));// 要读取的文件String text tesseract.doOCR(image);System.out.print(text);}catch (TesseractException e) {e.printStackTrace();}}R-C.jpg 图片
运行的结果如下