📜  pikepdf (1)

📅  最后修改于: 2023-12-03 15:33:41.642000             🧑  作者: Mango

Pikepdf介绍

简介

Pikepdf是一个用于创建、编辑以及提取PDF文件内容的Python库。它基于pandas,提供了许多实用的功能,其中包括内容编辑、加密、解密、合并、拆分和提取PDF文件等。Pikepdf还支持Rust扩展和多线程,这使得它具有很高的性能。

安装

Pikepdf可以通过pip包管理器进行安装。

pip install pikepdf
使用
创建PDF

要创建空白的PDF文件,可以使用以下代码:

import pikepdf

pdf = pikepdf.Pdf.new()
pdf.save("empty.pdf")
编辑PDF

要打开一个PDF文件并编辑它,可以使用以下代码:

import pikepdf

with pikepdf.open("input.pdf") as pdf:
    for page in pdf.pages:
        page.rotate = 90
    pdf.save("output.pdf")

上述代码将打开名为“input.pdf”的文件,将其中所有页面旋转90度,并将其保存为名为“output.pdf”的文件。

提取PDF内容

要提取PDF文件中的文本内容,可以使用以下代码:

import pikepdf

with pikepdf.open("input.pdf") as pdf:
    for page in pdf.pages:
        print(page.get_text())

上述代码将打开名为“input.pdf”的文件,并打印该文件的每个页面的文本内容。

合并PDF文件

要合并两个或多个PDF文件,可以使用以下代码:

import pikepdf

pdfs = ["file1.pdf", "file2.pdf", "file3.pdf"]

with pikepdf.open(pdfs[0]) as pdf:
    for source_pdf in pdfs[1:]:
        pdf.pages.extend(pikepdf.Pdf.open(source_pdf).pages)
    pdf.save("merged.pdf")

上述代码将打开名为“file1.pdf”的文件,并将其余两个文件的所有页面添加到该文件中。然后将所有页面保存为名为“merged.pdf”的文件。

结论

Pikepdf是一个非常实用的Python库,提供了很多有用的PDF处理工具。使用该库可以轻松地创建、编辑和提取PDF文件。在工作中遇到PDF文件时,不妨试试Pikepdf。