众所周知,计算机不会直接存储字母,数字和图片。它将它们转换成称为位的小块,它们具有两个值0或1。为了正确表示每个字母或数字,我们需要一些规则来正确存储它们。这些规则对应于编码模式。我们将研究3种最流行的存储编码模式:
ASCII码
ASCII代表美国信息交换标准码。 ASCII是由美国标准协会(ASA)在1963年引入的。 ASCII大致分为2个子类别:
- 标准ASCII:标准ASCII表示ASCII的前半部分,即从0到127的前128个字符。标准ASCII包括不可打印的和较低的ASCII。不可打印ASCII包含无法在屏幕上打印的字符,并包含各种系统代码。它们的范围从0到31。低位ASCII包含标准ASCII的剩余范围,即32到127。它包含字母,数字和特殊符号。
- 扩展ASCII:提出了扩展ASCII,因为尽管标准ASCII足以表示主要语言中的所有主要字符,但不足以涵盖所有主要字符。扩展ASCII通过添加更多128个字符来解决此问题,从而使ASCII字符总数达到256个。
ISCII
ISCII代表印度信息交换脚本代码。它是由印度标准局(BIS)于1991年提出的。它是一个8位标准,其中前128个字符(即从0到127)与标准ASCII相同。接下来的128个字符构成印度文字的字符。编码中包含印度使用的大多数流行语言。这些国家包括梵文,古吉拉特语,孟加拉语,奥里亚语,旁遮普语,阿萨姆语,卡纳达语,泰卢固语,马拉雅拉姆语,泰米尔语。
统一码
随着ASCII的发明,人们感到字符编码受到限制,不足以覆盖世界上所有的语言。因此,需要一种新的编码方案来覆盖所有语言。 Unicode联盟(Unicode Consortium)是一个非营利性组织,于1991年设计和开发了Unicode。最初,仅存在50,000个字符。但是今天,Unicode覆盖了128,000个字符。
Unicode编码类型:
- UTF-8:它使用8位进行编码。它用于Internet上的电子邮件。它是用于Web和软件程序的标准编码方案。
- UTF-16:它使用2个字节(即16位)进行编码。
- UTF-32:它使用4个字节(即32位)进行编码。
为什么我们需要Unicode?
- Unicode使我们可以为多种平台和语言设计单个应用程序。我们无需重新制作相同的应用程序即可用另一种语言启动它。
- 这导致降低了应用程序开发成本。
- 它可以防止数据损坏。
- 它充当跨所有语言和平台的单一编码架构。
- 它可以被视为所有编码模式的超集,因此我们可以将所有编码模式转换为Unicode,反之亦然。