📜  BeautifulSoup 中的漂亮打印

📅  最后修改于: 2022-05-13 01:55:00.126000             🧑  作者: Mango

BeautifulSoup 中的漂亮打印

先决条件:

  • 要求
  • 美汤

在本文中,我们将学习如何在BeautifulSoup 中打印漂亮 使用Python。 requests库是Python不可或缺的一部分,用于向指定的 URL 发出 HTTP 请求。无论是 REST API 还是 Web Scrapping,都必须学习请求才能进一步使用这些技术。当一个人向一个 URI 发出请求时,它会返回一个响应。 Python请求提供了用于管理请求和响应的内置功能。

pip install requests

Beautiful Soup 是一个Python库,专为快速周转项目(如屏幕抓取)而设计。

pip install beautifulsoup4

什么是漂亮印刷?

简单地说,我们可以说,它通过适当的缩进和一切来美化 HTML。

让我们一步一步地理解实现:-



  • 导入所需模块
Python3
# Import Required Module
import requests
from bs4 import BeautifulSoup


Python3
# Web URL
Web_url = "Enter WEB URL"
  
# Get URL Content
r = requests.get(Web_url)
  
# Parse HTML Code
soup = BeautifulSoup(r.content, 'html.parser')


Python3
print(soup.prettify())


Python3
# Import Required Module
import requests
from bs4 import BeautifulSoup
  
# Web URL
Web_url = "https://www.geeksforgeeks.org/transparent-window-in-tkinter/"
  
# Get URL Content
r = requests.get(Web_url)
  
# Parse HTML Code
soup = BeautifulSoup(r.content, 'html.parser')
print(soup.prettify())


  • 解析 HTML 内容

蟒蛇3

# Web URL
Web_url = "Enter WEB URL"
  
# Get URL Content
r = requests.get(Web_url)
  
# Parse HTML Code
soup = BeautifulSoup(r.content, 'html.parser')
  • 漂亮的 HTML 代码。 BeautifulSoup 有一个prettify()方法。

prettify()方法将一个 Beautiful Soup 解析树变成一个格式良好的 Unicode 字符串,每个标签和每个字符串都有一个单独的行:

蟒蛇3

print(soup.prettify())

下面是实现:

蟒蛇3

# Import Required Module
import requests
from bs4 import BeautifulSoup
  
# Web URL
Web_url = "https://www.geeksforgeeks.org/transparent-window-in-tkinter/"
  
# Get URL Content
r = requests.get(Web_url)
  
# Parse HTML Code
soup = BeautifulSoup(r.content, 'html.parser')
print(soup.prettify())

输出:

python bs4 漂亮的打印