哪个网站找做软件,网站运营策划书范文,潍坊做网站软件,wordpress 406原标题#xff1a;太赞了#xff01;Pdf转Word#xff0c;我用Python 轻松搞定表格和水印#xff01;继上一次为大家推出了将pdf转word之后(卧槽#xff01;Pdf转Word用Python轻松搞定#xff01;)#xff0c;引起了大家的热烈讨论#xff0c;我也总结了大家的一些意见…原标题太赞了Pdf转Word我用Python 轻松搞定表格和水印继上一次为大家推出了将pdf转word之后(卧槽Pdf转Word用Python轻松搞定)引起了大家的热烈讨论我也总结了大家的一些意见和建议今天就进一步的为大家推出一个新的版本。从pdf中提取表格数据并保存到本地的excel文件当中并且还为大家加入了添加水印和去除水印的功能。虽然在去除水印的效果上可能不如付费的项目那么好但是也足够大家在日常生活中进行使用下面我们就一起来看看吧。01.如何提取表格首先要面临的第一问题就是如何提取pdf中的表格如下图所示我们需要将上述的表格进行提取并保存到本地的excel文件之中程序如下所示上述程序中我们利用pdfplumber库来打开一个pdf文件然后如果我们想要提取某几页的表格可以在pageindexs这个形参中指明否则我们就提取pdf文件中所有的表格信息并保存到我们的本地excel表内结果如下图所示我们提取了pdf中所有的表格02.水印的处理接下来就是水印的处理我们先来进行添加水印也就是给我们的pdf文件添加我们的专属logo这里我们添加的是图片水印效果如下所示我们的程序也很简单上述程序中我们首先将水印图片利用word保存为pdf格式然后通过PyPDF2库中的PdfFileReader类来读取图片水印并通过PdfFileWriter添加到我们指定的pdf中完成图片水印的添加。既然有图片水印的添加那肯定有图片水印的去除其达到的效果就是上述程序达到的相反效果去除图片水印的程序如下图所示我们利用fitz库来打开pdf文件并统计里面的图片文件因为我们的图片水印也是图片所以能够得到水印图片的信息我们打印出来图片的信息其信息中的索引2和索引3就代表着图片的大小我们根据图片的大小判断是否为水印图片来隐藏pdf文件中的水印图片达到去除水印的目的。上述的程序针对的是图片水印但是我们日常面临的水印都是背景水印类似于下图的情况。这种情况下上述的程序就不管用了但是我们还有办法就是利用像素进行处理我们将pdf转换成图片然后调节图片的对比度和亮度来达到删除水印的目的然后将转换完后的图片转换为pdf即可部分程序如下图所示上述程序中是利用fitz库将pdf文件中的每页pdf转化成指定大小的图片文件并保存到指定的文件夹内。最终转化后的结果如下图所示上图我们可以看到我们成功的删除了背景水印但是由于调节的原因对于保留的文本也有一定的影响但是影响不是很大。如果大家感兴趣的话可以借鉴ps的处理技术通过背景水印模板来去除水印达到更好的去除效果但是这需要水印模板和我们pdf模板中的水印在位置形状和大小等方面完全一致要求比较高不如上述方法来的简单。以上就是小编今天为大家带来的分享我们完成了对于表格的提取和图片水印的添加和去除以及背景水印的去除大家也赶紧动手应用起来吧。后记自学编程的过程是很痛苦的有的时候没有人指导慢慢的会变成从入门到放弃 可能懂的人只要花1-2分钟就能帮你解决的问题不懂的人要折腾几个小时。最近不断的有小伙伴希望我们建一个 交流群有想加入的同学可以跟小助手联系。这个群的目的如下1. 帮助初学者的一起解惑一些入门的Python问题2. 我们经常有答题送书的福利有了群更容易联系到大家3. 已经在我们小密圈群的同学就不要再加入了避免重复入群目前青铜群已经有220多人我们采用筛选制度会根据一些后台数据进行筛选的生面孔或者不常来的我们一概谢绝入内。有专人进行答疑解惑入门问题。入群请找菜鸟哥暗号【入群】小助手最近在出差ing非常辛苦都不容易回复很慢大家多见谅哈返回搜狐查看更多责任编辑