处理文档Python .docx 模块
先决条件:使用 .docx 模块
Word 文档包含包装在三个对象级别内的格式化文本。最低层-运行对象,中层-段落对象,最高层-文档对象。因此,我们无法使用普通文本编辑器处理这些文档。但是,我们可以使用 python-docx 模块在Python中操作这些 word 文档。安装这个模块的pip命令是:
pip install python-docx
Python docx 模块允许用户通过操作现有文档或创建新的空文档并对其进行操作来操作文档。它是一个强大的工具,因为它可以帮助您在非常大的范围内操作文档。
现在,要使用 python-docx 模块,您必须将其导入为 docx。
# Import docx NOT python-docx
import docx
然后创建一个word文档的实例。我们将使用 docx 模块的 Document() 方法。
Syntax: docx.Document(String path)
Parameter:
- String path: It is an optional parameter. It specifies the path of the file to be open. If it is left empty then a new empty document file is created.
为了保存文档,我们将使用 docx 模块的 save() 方法。
Syntax: doc.save(String path_to_document)
Parameter:
- String path_to_document: It is the file name by which document will be saved. You can even put the path to where you want to save it.
示例 1:打开一个新文档。
Python3
# Import docx NOT python-docx
import docx
# Create an instance of a word document
doc = docx.Document()
# Now save the document to a location
doc.save('gfg.docx')
Python3
# Import docx NOT python-docx
import docx
# Opening a previously created document
doc = docx.Document('gfg.docx')
# Now save the document to a location
doc.save('gfg-copy.docx')
输出:
示例 2:打开以前创建的文档并再次使用不同的名称保存它。
蟒蛇3
# Import docx NOT python-docx
import docx
# Opening a previously created document
doc = docx.Document('gfg.docx')
# Now save the document to a location
doc.save('gfg-copy.docx')
输出: