ASCII:
ASCII码以1个字节(8位)表示,总共由128个字符表示,包括大写字母、小写字母、数字和一些符号。
GB2312:
为了对中文进行编码,中国制定了GB2312编码,一个汉字占2个字节。
统一码:
世界上每个国家都有自己的编码标准,因此使用多个国家的文本会出现乱码。
这时,Unicode编码标准出现了,将各种文本统一到Unicode字符集中,比较特殊的字符需要4个字节。
UTF-8:
Unicode标准解决了不同国家的文本编码冲突问题。目前,如果您的文本主要是英文,则使用Unicode 编码所需的存储空间是Ascii 编码的两倍。这就是UTF-8 的用武之地。它将Unicode字符编码为1-6个字节,特殊字符需要4-6个字节,UTF-8编码就可以了。它兼容ASCII编码,使得原本使用ASCII编码的软件能够成功运行。
计算机内存采用Unicode编码,由于可以快速访问内存中的定长代码,因此提高了处理效率。为了提高存储利用率,保存到硬盘时应使用UTF-8 编码。
当您在记事本中进行编辑时,从文件中读取的UTF-8 字符将转换为Unicode 字符并存储在内存中。编辑完成后,Unicode 会转换为UTF-8 并保存在文件中。
版权声明:本文转载于网络,版权归作者所有。如有侵权,请联系本站编辑删除。