📜  StAX Parser-概述

📅  最后修改于: 2020-11-10 04:39:22             🧑  作者: Mango


StAX是基于JAVA的API,以类似于SAX解析器的方式解析XML文档。但是两个API之间有两个主要区别点-

  • StAX是PULL API,而SAX是PUSH API。这意味着在使用StAX解析器的情况下,客户端应用程序需要在需要时要求StAX解析器从XML获取信息,但是在使用SAX解析器的情况下,当SAX解析器通知客户端应用程序该信息时,客户端应用程序需要获取信息。可用。

  • StAX API可以读取和写入XML文档。使用SAX API,只能读取xml。

以下是StAX API的功能-

  • 从上至下读取XML文档,识别构成格式正确的XML文档的标记。

  • 令牌的处理顺序与文档中出现的顺序相同。

  • 向应用程序报告解析器在令牌发生时遇到的令牌的性质。

  • 应用程序提供一个“事件”读取器,该读取器充当迭代器,并在事件上进行迭代以获取所需的信息。另一个可用的阅读器是“游标”阅读器,它充当xml节点的指针。

  • 识别事件后,可以从事件对象中检索xml元素,并可以对其进行进一步处理。

什么时候使用?

您应该在以下情况下使用StAX解析器:

  • 您可以从上到下以线性方式处理XML文档。

  • 该文档不是深层嵌套。

  • 您正在处理一个非常大的XML文档,该文档的DOM树将占用过多的内存。典型的DOM实现使用十个字节的内存来表示XML的一个字节。

  • 要解决的问题仅涉及XML文档的一部分。

  • 解析器一看到数据就可以使用,因此StAX对于通过流到达的XML文档非常有效。

SAX的缺点

  • 由于XML文档仅以向前方式进行处理,因此我们无法对其进行随机访问。

  • 如果需要跟踪解析器已查看的数据或更改项目的顺序,则必须编写代码并自行存储数据。

XMLEventReader类

此类提供事件的迭代器,可用于在解析XML文档时对事件进行迭代。

  • StartElement asStartElement() -用于检索元素的值和属性。

  • EndElement asEndElement() -在元素末尾调用。

  • 字符asCharacters() -可用于获取字符,例如CDATA,空格等。

XMLEventWriter类别

此接口指定用于创建事件的方法。

  • add(Event event) -将包含元素的事件添加到XML。

XMLStreamReader类

此类提供事件的迭代器,可用于在解析XML文档时对事件进行迭代。

  • int next() -用于检索下一个事件。

  • boolean hasNext() -用于检查是否存在其他事件

  • 字符串getText() -用于获取元素的文本

  • 字符串getLocalName() -用于获取元素的名称

XMLStreamWriter类

此接口指定用于创建事件的方法。

  • writeStartElement(String localName) -添加给定名称的开始元素。

  • writeEndElement(String localName) -添加给定名称的结束元素。

  • writeAttribute(String localName,String value) -将属性写入元素。