📜  在Python中使用 Minidom 解析 XML

📅  最后修改于: 2022-05-13 01:55:08.312000             🧑  作者: Mango

在Python中使用 Minidom 解析 XML

DOM(文档对象模型)是来自 W3C 的跨语言 API,即万维网联盟,用于访问和修改 XML 文档。 Python使您能够在xml.dom.minidom的帮助下解析 XML 文件,这是 DOM 接口的最小实现。它比完整的 DOM API 更简单,应该被认为更小。

解析 XML 的步骤是 -

  • 导入模块
import xml.dom.minidom

假设,您的 XML 文件将包含以下内容,

  • 使用 parse函数加载和解析 XML 文件。在以下情况下,docs 存储 parse函数的结果
docs = xml.dom.minidom.parse("test.xml")
  • 让我们打印 XML 文件的子标记名和节点名。
Python3
import xml.dom.minidom
  
docs = xml.dom.minidom.parse("test.xml")
  
print(docs.nodeName)
print(docs.firstChild.tagName)


Python3
import xml.dom.minidom
  
  
docs = xml.dom.minidom.parse("test.xml")
  
print(docs.nodeName)
print(docs.firstChild.tagName)
  
skills = docs.getElementsByTagName("skills")
  
print("%d skills" % skills.length)
for i in skills:
    print(i.getAttribute("name"))


输出:

#document
info
  • 现在要从标签名中获取信息,您需要调用 dom 标准函数getElementsByTagNamegetAttribute来获取所需的属性。

Python3

import xml.dom.minidom
  
  
docs = xml.dom.minidom.parse("test.xml")
  
print(docs.nodeName)
print(docs.firstChild.tagName)
  
skills = docs.getElementsByTagName("skills")
  
print("%d skills" % skills.length)
for i in skills:
    print(i.getAttribute("name"))

输出:

#document
info
4 skills
Machine learning
Deep learning
Python
Bootstrap