Python – 将 HTML字符转换为字符串
先决条件: html模块
给定一个包含 HTML字符的字符串,任务是将 HTML字符转换为字符串。这可以借助 html.escape() 方法(对于Python 3.4 + )来实现,我们可以通过使用 html.escape() 将 ASCII字符替换为特殊字符来将 ASCII字符串转换为 HTML 脚本 方法。
通过这种方法,我们可以将 HTML 实体解码为文本。
句法:
html.unescape(String)
我们也可以用美汤 处理实体转换。在 Beautiful Soup 4 中,实体会自动解码。
示例 1: Python 3.6+
Python3
# import html
import html
# Create Text
text = 'Γeeks for Γeeks'
# It Converts given text To String
print(html.unescape(text))
# It Converts given text to HTML Entities
print(html.escape(text))
Python3
#import html
import html
try:
# Python 2.6-2.7
from HTMLParser import HTMLParser
except ImportError:
# Python 3
from html.parser import HTMLParser
# for python 3
h = html.parser
print(h.unescape('Γeeks for Γeeks'))
输出:
Γeeks for Γeeks
Γeeks for Γeeks
示例 2: Python 2.6-3.3
我们可以使用标准库中的 HTMLParser.unescape() :
- 对于Python 2.6-2.7,它位于 HtmlParser 中。
- 对于Python 3,它在 html.parser 中
蟒蛇3
#import html
import html
try:
# Python 2.6-2.7
from HTMLParser import HTMLParser
except ImportError:
# Python 3
from html.parser import HTMLParser
# for python 3
h = html.parser
print(h.unescape('Γeeks for Γeeks'))
输出:
Γeeks for Γeeks