使用 Unihandecode 将 Unicode 更改为 ASCII字符
Unicode 通常表示为“\u4EB0\U5317”,但这对于真正想要阅读文本内容的用户来说几乎是无用的。所以在本文中,我们将看到如何使用 Unihandecode 模块将 Unicode 转换为 ASCII字符。
什么是 Unihandecode?
Unihandecode 提供了一个函数“decode(……)”,它以 Unicode 数据作为输入,并尝试用 ASCII字符来表示它。通俗地说,就是把Unicode中的所有字符都转换成ASCII字母表的一种音译。
解码器列表
- 'ja':日语汉字、平假名和片假名。
- 'zh':汉字
- 'kr':韩文字符
- 'vn':越南字符
安装
这个模块没有内置于Python中。要安装此类型,请在终端中输入以下命令。
pip install unihandecode
例子:
Python3
from unihandecode import Unihandecoder
data1 = Unihandecoder(lang='zh')
print(data1.decode("\u660e\u5929\u7684\u98ce\u5439"))
输出:
Ming Tian De Feng Chui
第一行参数采用您要使用的解码器的名称。然后解码器将字符串作为参数并返回音译后的字符串。