📜  什么是字符的内部存储编码(ISCII)?

📅  最后修改于: 2021-08-27 05:38:50             🧑  作者: Mango

众所周知,计算机不会直接存储字母,数字和图片。它将它们转换成称为位的小块,它们具有两个值0或1。为了正确表示每个字母或数字,我们需要一些规则来正确存储它们。这些规则对应于编码模式。我们将研究3种最流行的存储编码模式:

ASCII码

ASCII代表美国信息交换标准码。 ASCII是由美国标准协会(ASA)在1963年引入的。 ASCII大致分为2个子类别:

  • 标准ASCII:标准ASCII表示ASCII的前半部分,即从0到127的前128个字符。标准ASCII包括不可打印的和较低的ASCII。不可打印ASCII包含无法在屏幕上打印的字符,并包含各种系统代码。它们的范围从0到31。低位ASCII包含标准ASCII的剩余范围,即32到127。它包含字母,数字和特殊符号。
  • 扩展ASCII:提出了扩展ASCII,因为尽管标准ASCII足以表示主要语言中的所有主要字符,但不足以涵盖所有主要字符。扩展ASCII通过添加更多128个字符来解决此问题,从而使ASCII字符总数达到256个。

ISCII

ISCII代表印度信息交换脚本代码。它是由印度标准局(BIS)于1991年提出的。它是一个8位标准,其中前128个字符(即从0到127)与标准ASCII相同。接下来的128个字符构成印度文字的字符。编码中包含印度使用的大多数流行语言。这些国家包括梵文,古吉拉特语,孟加拉语,奥里亚语,旁遮普语,阿萨姆语,卡纳达语,泰卢固语,马拉雅拉姆语,泰米尔语。

统一码

随着ASCII的发明,人们感到字符编码受到限制,不足以覆盖世界上所有的语言。因此,需要一种新的编码方案来覆盖所有语言。 Unicode联盟(Unicode Consortium)是一个非营利性组织,于1991年设计和开发了Unicode。最初,仅存在50,000个字符。但是今天,Unicode覆盖了128,000个字符。

Unicode编码类型:

  • UTF-8:它使用8位进行编码。它用于Internet上的电子邮件。它是用于Web和软件程序的标准编码方案。
  • UTF-16:它使用2个字节(即16位)进行编码。
  • UTF-32:它使用4个字节(即32位)进行编码。

为什么我们需要Unicode?

  • Unicode使我们可以为多种平台和语言设计单个应用程序。我们无需重新制作相同的应用程序即可用另一种语言启动它。
  • 这导致降低了应用程序开发成本。
  • 它可以防止数据损坏。
  • 它充当跨所有语言和平台的单一编码架构。
  • 它可以被视为所有编码模式的超集,因此我们可以将所有编码模式转换为Unicode,反之亦然。