当前位置: 首页 > news >正文

个人网站可以做百度推广保定网站制作设计哪个公司好

个人网站可以做百度推广,保定网站制作设计哪个公司好,去哪里注册商标和品牌,ddns怎么做网站公众号后台回复“图书“#xff0c;了解更多号主新书内容作者#xff1a;陈熹来源#xff1a;早起Python导读大家好#xff0c;在之前的办公自动化系列文章中我们已经详细介绍了#x1f449;如何使用Python批量处理PDF文件#xff0c;包括合并、拆分、水印、加密等操作。… 公众号后台回复“图书“了解更多号主新书内容作者陈熹来源早起Python导读大家好在之前的办公自动化系列文章中我们已经详细介绍了如何使用Python批量处理PDF文件包括合并、拆分、水印、加密等操作。今天我们再次回到PDF详细讲解如何使用Python从PDF提取指定的信息。我们将以一份年度报告PDF为例进行介绍内含大量文字、表格、图片具体如下模块安装首先需要安装两个模块第一个是pdfplumber在命令行使用pip安装即可pip install pdfplumber第二个是fitz, 它是pymupdf中的一个模块同样可以使用pip轻松安装pip install pymupdf文字信息提取使用Python提取PDF中文字代码思路如下利用pdfplumber打开一个 PDF 文件获取指定的页或者遍历每一页利用.extract_text()方法提取当前页的文字现在让我们用上述代码尝试提取示例数据中第12页的文字import pdfplumber结果如下图所示接着可以将内容通过导入python-docx并借助wordfile.add_paragraph()写入Word文件中而这个模块我们已经讲解很多次此处就不再赘述。表格信息提取使用Python提取单个表格和提取单页文字的代码非常类似用的是.extract_table()但需要注意的是.extract_table()默认提取指定页面的第一个表格如果当前页面有多个表格都需要提取则要直接使用.extract_tables()例如示例文件中第 13 页有 2 个表格我们分别利用.extract_table()和.extract_tables()观察输出结果import pdfplumberfile_path  rC:\xxxx\practice.PDFwith pdfplumber.open(file_path) as pdf:    page  pdf.pages[12]    print(page.extract_table())结果如下可以看到是一个嵌套列表熟悉这种格式的人会理解想到可以pandas或者遍历该嵌套列表后借助openpyxl的sheet.append(list)写入Excel文件中import pdfplumber而.extract_tables()提取当前页所有表格会产生了一个三级嵌套列表第一层的列表就代表每一个表格之后也可以利用其他库写入Excel。图片提取对于图片提取现在没有任何一个模块可以做到百分之百的提取。本文只介绍基于fitz模块的代码基本思路是通过正则查找图片并将其输出例如提取示例文件中的图片代码可以这么写import fitz结果如下可以看到成功提取了图片但PDF中的图片远不止这些如果你有其他思路或者方法可以在留言区与我交流。写在最后最后要说明的是在上一篇文章及本文中我们剖析了每一行代码。但针对PDF的模块较多且有些模块功能并不完善代码也没有类似OFFICE三件套操作那般简洁因此更多时候以理解为主不需要完全掌握写会用会改即可当然还是希望大家能够理解Python办公自动化的一个核心就是批量操作-解放双手并且能与日常办公结合让复杂的工作自动化今天的文章就到这里原创不易如果喜欢的话请给我一波三连支持吧(在看、转发、留言)◆ ◆ ◆  ◆ ◆麟哥新书已经在当当上架了我写了本书《拿下Offer-数据分析师求职面试指南》目前当当正在举行活动大家可以用相当于原价5折的预购价格购买还是非常划算的点击下方小程序即可进入购买页面数据森麟公众号的交流群已经建立许多小伙伴已经加入其中感谢大家的支持。大家可以在群里交流关于数据分析数据挖掘的相关内容还没有加入的小伙伴可以扫描下方管理员二维码进群前一定要关注公众号奥关注后让管理员帮忙拉进群期待大家的加入。管理员二维码猜你喜欢● 麟哥拼了亲自出镜推荐自己新书《数据分析师求职面试指南》● 厉害了麟哥新书登顶京东销量排行榜● 笑死人不偿命的知乎沙雕问题排行榜● 用Python扒出B站那些“惊为天人”的阿婆主● 你相信逛B站也能学编程吗
http://www.zqtcl.cn/news/596569/

相关文章:

  • 外贸网站的推广技巧有哪些莱芜网吧
  • 溧阳城乡建设局网站ps中网站页面做多大的
  • sns社交网站 有哪些wordpress开发分类筛选
  • 黄石网站建设教程网上怎样查询企业资质
  • 国内设计师交流网站怎样做自己的网站钻钱
  • 无锡专业网站推广网络营销组合策略
  • 网站建设的安全威胁中国建设银行的网站色彩
  • 中小型企业网站建设与管理潍坊做网站哪家公司最好
  • 广州白云机场网站建设免费的网站模版
  • 商务网站建设策划书51网站怎么打开
  • 一个网站里面只放一个图片怎么做中国十大网络公司排名
  • 仓库网站开发怎么看一个网站做外链
  • 网站代码编辑器中国十大黑科技
  • 深圳网站建设一尘互联遵义网站开发哪家好
  • 室内设计师灵感网站汕头网站制作全过程
  • 网站改版是什么意思自己做的小网站分享
  • 秦皇岛公司做网站wordpress社交分享非插件
  • 做物流的都是上什么网站网络维护工程师工资多少
  • 莱芜市网站建设设计设计师互联网
  • 中国设计网网址山东seo网络营销推广
  • 常德市做公司网站的公司网站连接如何做二维码
  • 淮安网站设计蜜雪冰城网络营销论文
  • 网页设计与网站建设 入门必练宝安网站建设(深圳信科)
  • 黄石网站开发joomla 宠物网站模板
  • 网站建设公司成就需要详细填写
  • 培训机构网站如何建设商务网站建设目的
  • 好看响应式网站模板制作商城公司
  • 网站的主题有哪些专业做律师网站的公司
  • 大连做网站 选领超科技网站建设公司的成本有哪些方面
  • 文章网站是怎么做的宁波网站建设lonoo