📝 PDFBox教程
41篇技术文档📅  最后修改于: 2020-11-12 05:12:08        🧑  作者: Mango
Apache PDFBox是一个开源Java库,它支持PDF文档的开发和转换。在本教程中,我们将学习如何使用PDFBox开发可以创建,转换和处理PDF文档的Java程序。本教程已为初学者准备,使他们了解PDFBox库的基础。本教程将帮助读者构建涉及创建,操作和删除PDF文档的应用程序。先决条件对于本教程,假定读者具有Java编程语言的先验知识。...
📅  最后修改于: 2020-11-12 05:12:30        🧑  作者: Mango
可移植文档格式(PDF)是一种文件格式,可帮助以独立于应用程序软件,硬件和操作系统的方式显示数据。每个PDF文件都包含对固定版式平面文档的描述,包括文本,字体,图形和其他显示文档所需的信息。有几个库可用于通过程序创建和处理PDF文档,例如-Adobe PDF库-该库以C++,。NET和Java等语言提供API,使用它我们可以编辑,查看打印内容以及从PDF文档提取文本。格式化对象...
📅  最后修改于: 2020-11-12 05:12:59        🧑  作者: Mango
安装PDFBox以下是下载Apache PDFBox的步骤-第1步-打开的Apache PDFBox的通过点击以下链接主页-https://pdfbox.apache.org/步骤2-上面的链接将您带到首页,如以下屏幕截图所示-步骤3-现在,单击上方屏幕截图中突出显示的下载链接。单击后,您将转到PDFBox的下载页面,如以下屏幕截图所示。步骤4-在“下载”页面中,您将具有PDFBox的链接。单击相...
📅  最后修改于: 2020-11-12 05:13:20        🧑  作者: Mango
现在让我们了解如何使用PDFBox库创建PDF文档。创建一个空的PDF文档您可以通过实例化PDDocument类来创建一个空的PDF文档。您可以使用Save()方法将文档保存在所需的位置。以下是创建空白PDF文档的步骤。步骤1:创建一个空文档属于包org.apache.pdfbox.pdmodel的PDDocument类是PDFDocument的内存表示形式。因此,通过实例化此类,可以创建一个空的...
📅  最后修改于: 2020-11-12 05:13:42        🧑  作者: Mango
在上一章中,我们已经了解了如何创建PDF文档。创建PDF文档后,您需要向其中添加页面。现在让我们了解如何在PDF文档中添加页面。将页面添加到PDF文档您可以通过实例化PDPage类来创建一个空白页,并使用PDDocument类的addPage()方法将其添加到PDF文档中。以下是创建空文档并向其中添加页面的步骤。步骤1:创建一个空文档通过实例化PDDocument类,创建一个空的PDF文档,如下所...
📅  最后修改于: 2020-11-12 05:14:05        🧑  作者: Mango
在前面的示例中,您已经了解了如何创建一个新文档并向其中添加页面。本章教您如何加载系统中已经存在的PDF文档,并对其执行一些操作。加载现有的PDF文档PDDocument类的load()方法用于加载现有的PDF文档。请按照以下步骤加载现有的PDF文档。步骤1:加载现有的PDF文档使用PDDocument类的静态方法load()加载现有的PDF文档。该方法接受文件对象作为参数,因为这是一个静态方法,因...
📅  最后修改于: 2020-11-12 05:14:28        🧑  作者: Mango
现在让我们学习如何从PDF文档中删除页面。从现有文档中删除页面您可以使用PDDocument类的removePage()方法从现有的PDF文档中删除页面。步骤1:加载现有的PDF文档使用PDDocument类的静态方法load()加载现有的PDF文档。该方法接受文件对象作为参数,因为这是一个静态方法,因此您可以使用类名调用它,如下所示。步骤2:列出页数您可以使用getNumberOfPages()...
📅  最后修改于: 2020-11-12 05:15:14        🧑  作者: Mango
与其他文件一样,PDF文档也具有文档属性。这些属性是键值对。每个属性都提供有关文档的特定信息。以下是PDF文档的属性-S.No.Property & Description1FileThis property holds the name of the file.2TitleUsing this property, you can set the title for the document.3A...
📅  最后修改于: 2020-11-12 05:15:45        🧑  作者: Mango
在上一章中,我们讨论了如何将页面添加到PDF文档。在本章中,我们将讨论如何在现有的PDF文档中添加文本。将文本添加到现有的PDF文档中您可以使用PDFBox库将内容添加到文档,这为您提供了一个名为PDPageContentStream的类,该类包含在PDFDocument页面中插入文本,图像和其他类型的内容所需的方法。以下是创建空文档并将内容添加到其中的页面的步骤。步骤1:加载现有文档您可以使用P...
📅  最后修改于: 2020-11-12 05:16:23        🧑  作者: Mango
在上一章提供的示例中,我们讨论了如何在PDF页面中添加文本,但是通过此程序,您只能添加适合一行的文本。如果尝试添加更多内容,将不会显示超出行空间的所有文本。例如,如果您在上一章中通过传递以下字符串执行上述程序,则仅显示其中一部分。与上述字符串上一章替换例子的字符串文本并执行它。执行后,您将收到以下输出。如果仔细观察输出,您会注意到仅显示了字符串的一部分。为了向PDF添加多行,您需要使用setLea...
📅  最后修改于: 2020-11-12 05:16:45        🧑  作者: Mango
在上一章中,我们已经看到了如何在现有的PDF文档中添加文本。在本章中,我们将讨论如何从现有的PDF文档中读取文本。从现有的PDF文档中提取文本提取文本是PDF框库的主要功能之一。您可以使用PDFTextStripper类的getText()方法提取文本。此类从给定的PDF文档中提取所有文本。以下是从现有PDF文档提取文本的步骤。步骤1:加载现有的PDF文档使用PDDocument类的静态方法loa...
📅  最后修改于: 2020-11-12 05:17:13        🧑  作者: Mango
在上一章中,我们了解了如何从现有的PDF文档中提取文本。在本章中,我们将讨论如何将图像插入PDF文档。将图像插入PDF文档您可以分别使用类PDImageXObject和PDPageContentStream的createFromFile()和drawImage()方法将图像插入PDF文档。以下是从现有PDF文档提取文本的步骤。步骤1:加载现有的PDF文档使用PDDocument类的静态方法load...
📅  最后修改于: 2020-11-12 05:17:40        🧑  作者: Mango
在上一章中,我们已经了解了如何在PDF文档中插入图像。在本章中,我们将讨论如何加密PDF文档。加密PDF文档您可以使用StandardProtectionPolicy和AccessPermission类提供的方法对PDF文档进行加密。AccessPermission类用于通过为其分配访问权限来保护PDF文档。使用此类,您可以限制用户执行以下操作。打印文件修改文件内容复制或提取文档内容添加或修改注释...
📅  最后修改于: 2020-11-12 05:18:03        🧑  作者: Mango
在上一章中,我们学习了如何将图像插入PDF文档。在本章中,我们将讨论如何将JavaScript添加到PDF文档中。将JavaScript添加到PDF文档您可以使用PDActionJavaScript类将JavaScript操作添加到PDF文档中。这表示一个JavaScript操作。以下是将JavaScript操作添加到现有PDF文档的步骤。步骤1:加载现有的PDF文档使用PDDocument类的静...
📅  最后修改于: 2020-11-12 05:18:28        🧑  作者: Mango
在上一章中,我们已经了解了如何将JavaScript添加到PDF文档中。现在让我们学习如何将给定的PDF文档拆分为多个文档。分割PDF文档中的页面您可以使用名为Splitter的类将给定的PDF文档拆分为多个PDF文档。此类用于将给定的PDF文档拆分为其他几个文档。以下是拆分现有PDF文档的步骤步骤1:加载现有的PDF文档使用PDDocument类的静态方法load()加载现有的PDF文档。该方法...