📜  Java Unicode系统

📅  最后修改于: 2020-09-24 00:50:56             🧑  作者: Mango

Unicode系统

Unicode是一种通用的国际标准字符编码,能够代表世界上大多数书面语言。

为什么Java使用Unicode系统?

在Unicode之前,有许多语言标准:

  • 美国的ASCII(美国信息交换标准代码)。
  • 用于西欧语言的ISO 8859-1
  • KOI-8(俄语)。
  • GB18030和BIG-5(中文)等等。

导致的问题

这导致了两个问题:

  • 特定的代码值对应于各种语言标准中的不同字母。
  • 具有大字符集的语言的编码具有可变的长度。一些常见字符被编码为单个字节,其他一些则需要两个或更多字节。

一般的解决方案

为了解决这些问题,开发了一种新的语言标准,即Unicode系统。

在unicode中,character保留2个字节,因此java还将2个字节用于字符。

最低值: \ u0000

最高值: \ uFFFF