📜  使用 Unihandecode 将 Unicode 更改为 ASCII字符

📅  最后修改于: 2022-05-13 01:55:01.144000             🧑  作者: Mango

使用 Unihandecode 将 Unicode 更改为 ASCII字符

Unicode 通常表示为“\u4EB0\U5317”,但这对于真正想要阅读文本内容的用户来说几乎是无用的。所以在本文中,我们将看到如何使用 Unihandecode 模块将 Unicode 转换为 ASCII字符。

什么是 Unihandecode?

Unihandecode 提供了一个函数“decode(……)”,它以 Unicode 数据作为输入,并尝试用 ASCII字符来表示它。通俗地说,就是把Unicode中的所有字符都转换成ASCII字母表的一种音译。

解码器列表

  • 'ja':日语汉字、平假名和片假名。
  • 'zh':汉字 
  • 'kr':韩文字符
  • 'vn':越南字符

安装

这个模块没有内置于Python中。要安装此类型,请在终端中输入以下命令。

pip install unihandecode 

例子:

Python3
from unihandecode import Unihandecoder
  
data1 = Unihandecoder(lang='zh')
print(data1.decode("\u660e\u5929\u7684\u98ce\u5439"))


输出:

Ming Tian De Feng Chui

第一行参数采用您要使用的解码器的名称。然后解码器将字符串作为参数并返回音译后的字符串。