📜  处理文档Python .docx 模块

📅  最后修改于: 2022-05-13 01:54:20.868000             🧑  作者: Mango

处理文档Python .docx 模块

先决条件:使用 .docx 模块

Word 文档包含包装在三个对象级别内的格式化文本。最低层-运行对象,中层-段落对象,最高层-文档对象。因此,我们无法使用普通文本编辑器处理这些文档。但是,我们可以使用 python-docx 模块在Python中操作这些 word 文档。安装这个模块的pip命令是:

pip install python-docx

Python docx 模块允许用户通过操作现有文档或创建新的空文档并对其进行操作来操作文档。它是一个强大的工具,因为它可以帮助您在非常大的范围内操作文档。

现在,要使用 python-docx 模块,您必须将其导入为 docx。

# Import docx NOT python-docx
import docx

然后创建一个word文档的实例。我们将使用 docx 模块的 Document() 方法。

为了保存文档,我们将使用 docx 模块的 save() 方法。

示例 1:打开一个新文档。

Python3
# Import docx NOT python-docx
import docx
  
# Create an instance of a word document
doc = docx.Document()
  
# Now save the document to a location 
doc.save('gfg.docx')


Python3
# Import docx NOT python-docx
import docx
  
# Opening a previously created document
doc = docx.Document('gfg.docx')
  
# Now save the document to a location 
doc.save('gfg-copy.docx')


输出:

示例 2:打开以前创建的文档并再次使用不同的名称保存它。

蟒蛇3

# Import docx NOT python-docx
import docx
  
# Opening a previously created document
doc = docx.Document('gfg.docx')
  
# Now save the document to a location 
doc.save('gfg-copy.docx')

输出: