当前位置: 首页 > news >正文

上海设计网站开发视频 主题 wordpress

上海设计网站开发,视频 主题 wordpress,wordpress去掉google,网络营销ppt讲解最近几天#xff0c;paddleOCR开发了新的功能#xff0c;通过将图片中的表格提取出来#xff0c;效果还不错#xff0c;今天#xff0c;作者按照步骤测试了一波。 首先#xff0c;讲下这个工具是干什么用的#xff1a;它的功能主要是针对一张完整的PDF图片#xff0c;可…最近几天paddleOCR开发了新的功能通过将图片中的表格提取出来效果还不错今天作者按照步骤测试了一波。 首先讲下这个工具是干什么用的它的功能主要是针对一张完整的PDF图片可以对文档图片中的文本、表格、图片、标题与列表区域进行分类。同时还可以利用表格识别技术完整地提取表格结构信息使得表格图片变为可编辑的Excel文件。如下图所示可以进行版面分析表格识别。 核心技术在于两个一个是PP-Structure的版面分析技术另一个是PaddleDetection开源的高效检测算法PP-YOLO v2。 PP-Structure Pipeline介绍 下面作者按照官网的说明进行安装(https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.2/ppstructure/README_ch.md) #step1: 首先需要安装paddle # GPU安装 python -m pip install paddlepaddle-gpu2.1.1 -i https://mirror.baidu.com/pypi/simple # CPU安装作者在这里使用CPU安装  python -m pip install paddlepaddle2.1.1 -i https://mirror.baidu.com/pypi/simple #step2安装 Layout-Parser pip  install -U https://paddleocr.bj.bcebos.com/whl/layoutparser-0.0.0-py3-none-any.whl #step3安装PaddleOCR包含PP-OCR和PP-Structure pip install paddleocr2.2 这样就算安装好了但是途中会有一些报错信息一个是 ImportError: DLL load failed: 找不到指定的模块。 在查阅了相关的资料之后发现重新安装也没有用作者是通过安装旧版本的软件就解决了这个问题。另一个报错是cv2.imread读取图像结果为none,这个错误是由于你的路径中有中文字体全部修改为英文的即可。 接下来就是运行主要的程序代码 1 import os2 import cv23 from paddleocr import PPStructure,draw_structure_result,save_structure_res4 5 table_engine PPStructure(show_logTrue)6 7 #你的文件结果目录8 save_folder C:/Users/hp/Desktop/pdf_ocr/output/table9  10 #输入的图片 11 img_path C:/Users/hp/Desktop/pdf_ocr/table/5.png 12 img cv2.imread(img_path) 13  14 result table_engine(img) 15 save_structure_res(result, save_folder,os.path.basename(img_path).split(.)[0]) 16  17 for line in result: 18     line.pop(img) 19     print(line) 20  21 from PIL import Image 22  23 #字体路径可以从paddleOCR的github上面下载 24 font_path C:/Users/hp/Desktop/pdf_ocr/fonts/simfang.ttf25 image Image.open(img_path).convert(RGB) 26 im_show draw_structure_result(image, result,font_pathfont_path) 27 im_show Image.fromarray(im_show) 28 im_show.save(result.jpg)运行完成后每张图片会在​​output​​字段指定的目录下有一个同名目录图片里的每个表格会存储为一个excel图片区域会被裁剪之后保存下来excel文件和图片名名为表格在图片里的坐标。 这样就可以看到识别出来的excel表格了。
http://www.zqtcl.cn/news/241238/

相关文章:

  • 如何自己弄网站怎么用手机做网站服务器
  • 如果我的网站被百度收录了_以后如何做更新争取更多收录有做不锈钢工程的网站
  • 适合做公司网站的cms东莞阳光网站投诉平台
  • 建设一个网站的意义印刷东莞网站建设技术支持
  • 80端口被封怎么做网站个人网站做支付接口
  • 如何区分网站开发语言建设网站地图素材
  • 建网站的流程怎么投稿各大媒体网站
  • 品牌推广的步骤和技巧专业seo培训学校
  • 新网站上线怎么做seo网站建设语言什么语言
  • 山东省住房城乡和建设厅网站黄页网站推广下载免费
  • 网站建设与运营的论文的范本百度秒收录蜘蛛池
  • asp.net做音乐网站wordpress伪静态规则iis
  • seo 网站优化2021给个最新网站
  • 做废铝的关注哪个网站好seo推广优化的方法
  • 广州活动网站设计电影网站建设策划书
  • 4a景区网站建设标准网站建设排名优化公司
  • 闲置服务器做网站简单做图网站
  • 网站建设制作软件叫啥网盟推广是什么
  • 常州市住房建设局网站大连设计网站的公司
  • 通用wap网站生成系统wordpress 安装旧版本
  • 做网站用的产品展示横幅手机app开发技术
  • 学校网站模板 中文版沈阳seo博客
  • seo策划方案整站优化服务
  • 灵芝产品网站建设方案wordpress登录开发
  • 企业网站软件开发部署php网站
  • 云服务器怎么搭建网站网站制作软件是什么
  • 网站建设的结尾官网网站设计
  • 网站开发网页超链接路径如何用dw修改wordpress的首页
  • 龙岗开发公司网站建设简述网站的制作流程
  • 杭州手机建站模板尤溪建设局网站