Jsoup MVN 依赖 (1) - 芒果文档

📌 相关文章

📜 Jsoup MVN 依赖 (1)

📅 最后修改于: 2023-12-03 15:32:25.587000 🧑 作者: Mango

Jsoup MVN 依赖

简介

Jsoup是一款用于解析HTML文档的Java库，它提供了简便的API，使得从HTML文档中提取数据变得易如反掌。借助Jsoup，程序员可以轻松地从HTML文档中获取数据，并对页面进行简单的操作，比如实现爬虫、数据挖掘等。

MVN 依赖

如果想在Java项目中使用Jsoup，需要在项目的pom文件中添加以下依赖：

<dependency>
   <groupId>org.jsoup</groupId>
   <artifactId>jsoup</artifactId>
   <version>1.14.3</version>
</dependency>

此处的groupId为org.jsoup，artifactId为jsoup，版本号为1.14.3。添加了该依赖，即可在Java项目中使用Jsoup提供的API。

使用示例

接下来，我们以一个简单的示例来演示如何使用Jsoup提取HTML文档中的数据。

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupExample {
   public static void main(String[] args) throws IOException {
      String url = "https://www.baidu.com";
      Document doc = Jsoup.connect(url).get();
      Elements links = doc.select("a[href]");
      for (Element link : links) {
         System.out.println("link : " + link.attr("href"));
         System.out.println("text : " + link.text());
      }
   }
}

此处，我们通过Jsoup连接到百度搜索的网页，获取网页中所有的链接并输出链接的href和text。

总结

本篇介绍了Jsoup MVN 依赖的作用，以及该库的简介和使用示例。借助Jsoup，程序员可以轻松地从HTML文档中提取数据，并且它提供了便捷的API，使得开发效率更高。