📅  最后修改于: 2020-11-13 05:52:49             🧑  作者: Mango
jsoup是一个基于Java的库,用于处理基于HTML的内容。它提供了一个非常方便的API,可以使用DOM,CSS和类似jquery的最佳方法来提取和处理数据。它实现WHATWG HTML5规范,并将HTML解析为与现代浏览器相同的DOM。
jsoup libary实现WHATWG HTML5规范,并将HTML内容解析为与现代浏览器相同的DOM。
jsonp库提供以下功能。
多重读取支持-它使用URL,文件或字符串读取和解析HTML。
CSS选择器-它可以使用DOM遍历或CSS选择器来查找和提取数据。
DOM操纵-它可以操纵HTML元素,属性和文本。
防止XSS攻击-它可以根据给定的安全白名单清除用户提交的内容,以防止XSS攻击。
整洁-输出整洁的HTML。
处理无效数据-jsoup可以处理未关闭的标签,隐式标签,并可以可靠地创建文档结构。