📜  Apache POI Word-概述

📅  最后修改于: 2020-11-18 08:54:16             🧑  作者: Mango


很多时候,需要一个软件应用程序来生成Microsoft Word文件格式的参考文档。有时,甚至期望应用程序接收Word文件作为输入数据。

任何想要将MS-Office文件作为输出生成的Java程序员都必须使用预定义的只读API来进行。

什么是Apache POI?

Apache POI是一种流行的API,允许程序员使用Java程序创建,修改和显示MS-Office文件。它是由Apache Software Foundation开发和分发的开源库,用于使用Java程序设计或修改MS-Office文件。它包含用于将用户输入数据或文件解码为MS-Office文档的类和方法。

Apache POI的组件

Apache POI包含可在MS-Office的所有OLE2 Compound文档上使用的类和方法。该API的组件列表如下-

  • POIFS(差的模糊实现文件系统) -此组件是所有其他POI元素的基本因素。它用于显式读取不同的文件。

  • HSSF(可怕的SpreadSheet格式) -用于读取和写入MS-Excel文件的.xls格式。

  • XSSF(XML SpreadSheet格式) -用于MS-Excel的.xlsx文件格式。

  • HPSF(可怕的属性集格式) -用于提取MS-Office文件的属性集。

  • HWPF(可怕的文字处理器格式) -用于读取和写入MS-Word的.doc扩展文件。

  • XWPF(XML字处理器格式) -用于读取和写入MS-Word的.docx扩展文件。

  • HSLF(可怕的幻灯片布局格式) -用于读取,创建和编辑PowerPoint演示文稿。

  • HDGF(可怕的DiaGram格式) -它包含MS-Visio二进制文件的类和方法。

  • HPBF(可怕的PuBlisher格式) -用于读取和写入MS-Publisher文件。

本教程将指导您完成使用Java处理MS-Word文件的过程。因此,讨论仅限于HWPF和XWPF组件。

注意-POI支持二进制文件格式的旧版本,例如DOC,XLS,PPT,ETC。从版本3.5开始,POI支持OOXML文件格式,例如DOCX,XLSX,PPTX,ETC等MS-OFFICE。