📅  最后修改于: 2023-12-03 15:02:26.377000             🧑  作者: Mango
Jsoup是一种流行的Java HTML解析器和文档操作库。它可以用于从HTML中提取数据、操作和修改HTML文档。以下是如何使用Jsoup设置HTML的一些介绍。
首先,需要在项目中添加Jsoup依赖。
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.14.3</version>
</dependency>
可以使用Jsoup来创建HTML文档。
Document doc = Document.createShell("");
doc.head().append("<title>Jsoup HTML document</title>");
doc.body().append("<h1>Welcome to Jsoup</h1>");
System.out.println(doc);
这个例子创建了一个空的HTML文档,并向文档头添加了一个标题,向文档主体添加了一个标题。
可以使用Jsoup来修改HTML文档。
Document doc = Jsoup.connect("http://example.com").get();
Element link = doc.select("a").first();
link.attr("href", "http://new.url.com");
System.out.println(doc);
这个例子从http://example.com
下载HTML文档,并将第一个<a>
元素的href
属性修改为http://new.url.com
。
可以使用Jsoup从HTML中提取数据。
Document doc = Jsoup.connect("http://example.com").get();
Elements links = doc.select("a");
for (Element link : links) {
System.out.println(link.attr("href"));
}
这个例子从http://example.com
下载HTML文档,并打印所有<a>
元素的href
属性。
可以使用Jsoup过滤HTML元素。
Document doc = Jsoup.connect("http://example.com").get();
Elements images = doc.select("img[src~=(?i)\\.(png|jpe?g|gif)]");
for (Element image : images) {
System.out.println(image.attr("src"));
}
这个例子从http://example.com
下载HTML文档,并打印所有PNG、JPEG和GIF图像的src
属性。
以上是使用Jsoup设置HTML的一些介绍。如果你需要更多的信息,可以参考Jsoup官方文档。