📜  python 合并 pdfs - Python (1)

📅  最后修改于: 2023-12-03 14:46:13.493000             🧑  作者: Mango

合并 PDFs 使用 Python

在编写 Python 程序时,我们经常遇到需要处理 PDF 文件的情况。合并多个 PDF 文件成为一个文件是其中之一。在本文中,我将介绍如何使用 Python 合并 PDF 文件。

我们将使用的库
  • PyPDF2:一个用于处理 PDF 文件的库,可以用来读取、写入和合并 PDF。

确保你已经安装了 PyPDF2,可以使用以下命令安装:

pip install PyPDF2
示例代码
import PyPDF2

def merge_pdfs(output_path, *input_paths):
    pdf_writer = PyPDF2.PdfFileWriter()

    for path in input_paths:
        pdf_reader = PyPDF2.PdfFileReader(path)
        for page_num in range(pdf_reader.getNumPages()):
            page = pdf_reader.getPage(page_num)
            pdf_writer.addPage(page)

    with open(output_path, 'wb') as output_file:
        pdf_writer.write(output_file)

if __name__ == '__main__':
    input_files = ['document1.pdf', 'document2.pdf', 'document3.pdf']
    output_file = 'combined.pdf'
    merge_pdfs(output_file, *input_files)
代码说明
  1. 首先,我们导入 PyPDF2 库。
  2. 然后,定义一个名为 merge_pdfs 的函数,它接受输出文件路径和任意数量的输入文件路径作为参数。
  3. 在函数中,我们创建一个 PdfFileWriter 对象,用于写入合并后的 PDF 文件。
  4. 对于每个输入文件,我们使用 PdfFileReader 对象读取文件并遍历其中的每一页。
  5. 通过调用 PdfFileReader 对象的 getPage 方法获取每一页的内容,并使用 PdfFileWriter 对象的 addPage 方法将其添加到合并后的文件中。
  6. 最后,我们使用 with 语句打开输出文件,并调用 write 方法将合并后的 PDF 写入输出文件中。
  7. main 函数中,我们定义了输入文件列表和输出文件路径,并调用 merge_pdfs 函数执行合并操作。

注意:在上面的示例代码中,合并后的 PDF 文件被命名为 combined.pdf,输入文件列表为 ['document1.pdf', 'document2.pdf', 'document3.pdf']。你可以根据需要修改这些值。

希望这个简单的示例代码能帮助你理解如何使用 Python 合并 PDF 文件。你还可以根据自己的需求进行修改和扩展。