📅  最后修改于: 2023-12-03 15:39:19.539000             🧑  作者: Mango
有时候我们需要将 Python 中的汤(BeautifulSoup 对象)保存为 HTML 文件,以供后续的分析和处理。下面介绍两种将汤另存为 HTML 的方法。
将汤保存为 HTML 最简单的方法是使用 prettify()
方法。prettify()
方法可以将汤按照标准的格式输出,便于阅读和分析。
from bs4 import BeautifulSoup
# 创建一个简单的 HTML 文档
html_doc = '<html><head><title>Page title</title></head><body><p>First paragraph.</p></body></html>'
soup = BeautifulSoup(html_doc, 'html.parser')
# 将汤保存为 HTML 文件
with open('output.html', 'w') as f:
f.write(soup.prettify())
在上面的例子中,我们创建了一个简单的 HTML 文档,并使用 prettify()
方法将其保存为 output.html
文件。可以使用文本编辑器或浏览器打开此文件,查看保存的结果。
```python
from bs4 import BeautifulSoup
# 创建一个简单的 HTML 文档
html_doc = '<html><head><title>Page title</title></head><body><p>First paragraph.</p></body></html>'
soup = BeautifulSoup(html_doc, 'html.parser')
# 将汤保存为 HTML 文件
with open('output.html', 'w') as f:
f.write(soup.prettify())
## 方法二:使用 encode() 方法
另一种将汤保存为 HTML 的方法是使用 `encode()` 方法。`encode()` 方法将汤编码为字符串,可以指定编码类型,然后将字符串保存为文件。
```python
from bs4 import BeautifulSoup
# 创建一个简单的 HTML 文档
html_doc = '<html><head><title>Page title</title></head><body><p>First paragraph.</p></body></html>'
soup = BeautifulSoup(html_doc, 'html.parser')
# 将汤保存为 HTML 文件
with open('output.html', 'w') as f:
f.write(soup.encode('utf-8'))
在上面的例子中,我们使用 encode()
方法将汤编码为 UTF-8 字符串,并保存为 output.html
文件。可以使用文本编辑器或浏览器打开此文件,查看保存的结果。
```python
from bs4 import BeautifulSoup
# 创建一个简单的 HTML 文档
html_doc = '<html><head><title>Page title</title></head><body><p>First paragraph.</p></body></html>'
soup = BeautifulSoup(html_doc, 'html.parser')
# 将汤保存为 HTML 文件
with open('output.html', 'w') as f:
f.write(soup.encode('utf-8'))