📅  最后修改于: 2023-12-03 15:35:47.152000             🧑  作者: Mango
XML,全称为可扩展标记语言(Extensible Markup Language),是一种标准的、可扩展的标记语言。它被设计用来传输和存储数据。与 HTML 不同,XML 不是一种预定义的标记语言,而是允许使用者自己定义标记语言,用于表示任意类型的数据。XML 的语法相对简单,但可以用于描述各种不同类型的数据,并且很容易被计算机处理和解析。
XML 文件采用纯文本形式,具有可读性,易于扩展,并且跨平台。由于 XML 不受编程语言或操作系统的限制,因此广泛用于 Web 服务、数据传输和数据存储等领域。
XML 文档必须遵守一定的语法规则,才能被正确解析。一个 XML 文档由以下几个部分组成:
XML 声明用于指定 XML 版本和编码方式,格式如下:
<?xml version="1.0" encoding="UTF-8"?>
其中,version
属性指定 XML 版本,encoding
属性指定编码方式。XML 允许使用多种编码方式,但 UTF-8 是一种广泛使用的编码方式。
DOCTYPE 声明用于指定 XML 文档类型及其约束规则,格式如下:
<!DOCTYPE root_element SYSTEM "dtd_file.dtd">
其中,root_element
指定文档的根元素,dtd_file.dtd
指定文档类型定义文件的位置。在 XML 中,文档类型定义(DTD)用于规定 XML 文档的结构和规范。可以使用内部 DTD 或外部 DTD,以约束 XML 文档中允许存在的元素、属性、实体等。
元素是 XML 文档的基本组成单元,格式如下:
<element>content</element>
其中,element
为元素名,content
为元素内容。元素可以包含子元素、属性等。元素名不允许出现空格,可以使用字母、数字、下划线和冒号。
属性用于描述元素的特性,格式如下:
<element attribute="value">content</element>
其中,attribute
为属性名,value
为属性值。一个元素可以包含多个属性,属性之间用空格或换行符分隔。
注释用于添加对 XML 文档的说明,格式如下:
<!-- This is a comment -->
下面是一个简单的 XML 文档,用于描述学生信息:
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE student SYSTEM "student.dtd">
<student>
<name>张三</name>
<age>20</age>
<gender>男</gender>
<major>计算机科学与技术</major>
<class>2020级1班</class>
<!-- This is a comment -->
</student>
其中,student.dtd
文件内容如下:
<!ELEMENT student (name, age, gender, major, class)>
<!ELEMENT name (#PCDATA)>
<!ELEMENT age (#PCDATA)>
<!ELEMENT gender (#PCDATA)>
<!ELEMENT major (#PCDATA)>
<!ELEMENT class (#PCDATA)>
这个 DTD 文件规定了 student
元素必须包含 name
、age
、gender
、major
和 class
五个子元素,并且这些子元素的内容必须为文本内容。