在Python中使用 Minidom 解析 XML
DOM(文档对象模型)是来自 W3C 的跨语言 API,即万维网联盟,用于访问和修改 XML 文档。 Python使您能够在xml.dom.minidom的帮助下解析 XML 文件,这是 DOM 接口的最小实现。它比完整的 DOM API 更简单,应该被认为更小。
解析 XML 的步骤是 -
- 导入模块
import xml.dom.minidom
假设,您的 XML 文件将包含以下内容,
- 使用 parse函数加载和解析 XML 文件。在以下情况下,docs 存储 parse函数的结果
docs = xml.dom.minidom.parse("test.xml")
- 让我们打印 XML 文件的子标记名和节点名。
Python3
import xml.dom.minidom
docs = xml.dom.minidom.parse("test.xml")
print(docs.nodeName)
print(docs.firstChild.tagName)
Python3
import xml.dom.minidom
docs = xml.dom.minidom.parse("test.xml")
print(docs.nodeName)
print(docs.firstChild.tagName)
skills = docs.getElementsByTagName("skills")
print("%d skills" % skills.length)
for i in skills:
print(i.getAttribute("name"))
输出:
#document
info
- 现在要从标签名中获取信息,您需要调用 dom 标准函数getElementsByTagName和getAttribute来获取所需的属性。
Python3
import xml.dom.minidom
docs = xml.dom.minidom.parse("test.xml")
print(docs.nodeName)
print(docs.firstChild.tagName)
skills = docs.getElementsByTagName("skills")
print("%d skills" % skills.length)
for i in skills:
print(i.getAttribute("name"))
输出:
#document
info
4 skills
Machine learning
Deep learning
Python
Bootstrap