📜  XML-字符实体

📅  最后修改于: 2020-11-09 05:27:19             🧑  作者: Mango


本章介绍XML字符实体。在了解字符实体之前,让我们首先了解什么是XML实体。

正如W3联盟所指出的,实体的定义如下-

“文档实体是实体树的根,也是XML处理器的起点”。

这意味着,实体是XML中的占位符。这些可以在文档序言或DTD中声明。有不同类型的实体,在本章中,我们将讨论字符实体。

HTML和XML都保留了一些符号供其使用,这些符号不能用作XML代码中的内容。例如, <>符号用于打开和关闭XML标签。要显示这些特殊字符,请使用字符实体。

很少有特殊字符或符号无法直接从键盘上键入。字符实体也可以用于显示那些符号/特殊字符。

字符实体的类型

字符实体有三种类型-

  • 预定义字符实体
  • 编号字符实体
  • 命名字符实体

预定义字符实体

引入它们是为了避免在使用某些符号时产生歧义。例如,将小于( < )或大于( > )符号与角度标签( <> )一起使用时,会观察到歧义。字符实体基本上用于分隔XML中的标签。以下是XML规范中的预定义字符实体的列表。这些可以用来表达字符而没有歧义。

  • 符- &amp;

  • 单引号-

  • 大于- &gt;

  • 小于- &lt;

  • 双引号- &quot;

数字字符实体

数字引用用于引用字符实体。数字参考可以是十进制或十六进制格式。由于有成千上万的数字引用可供使用,因此很难记住。数字引用通过Unicode字符集中的数字来引用该字符。

十进制数字引用的一般语法是-

decimal number ;

十六进制数字参考的通用语法是-

Hexadecimal number ;

下表列出了一些预定义的字符实体及其数值-

Entity name Character Decimal reference Hexadecimal reference
quot " "
amp & & &
apos ' '
lt < < <
gt > > >

命名字符实体

由于很难记住数字字符,因此,字符实体的首选类型是命名字符实体。在此,每个实体都用一个名称标识。

例如-

  • “急性”代表资本字符。

  • “ ugrave”代表小口音很重