中文编码标准及其兼容性
<font color="#ff0000">GB2312-80</font>:80年出台,简体中文,收录文字6763个。别名euc-cn、区位码,代码页cp20936。<font color="#0000ff">BIG5</font>:繁体中文,收录文字13053个,代码页cp950。<font color="#ff0000">GB 13000.1</font>:等同于 ISO 10646.1,93年出台,包括简体、繁体、日文、朝鲜文。<font color="#0000ff">GBK</font>: 95年出台,收录文字21003个。包括简体、繁体、日文、朝鲜文。兼容gb2312,不兼容BIG5,收录了很多生僻字。代码页cp936。<font color="#ff0000">GB18030-2000</font>: 2000年出台的强制标准,2001年正式实行,收录文字27533个,包括简体、繁体、少数民族文字,日文、朝鲜文。兼容GBK,不兼容BIG5。代码页cp54936。国际通用的编码:<font color="#ff0000">Unicode</font>:全球统一的字符编码,版本不断在更新中,每个版本会增加一些字符。存储格式可以是UCS-2或UCS-4。前者用2个字节表示一个字符,后者用4个字节。<font color="#0000ff">UTF</font>: unicode的一种编码形式,有UTF-7、UTF-8、UTF-16、UTF-32几个标准。UTF-8用途最广泛。UTF-8代码页cp65001更详细的信息参考:<a href="http://blog.csdn.net/chc05/archive/2007/08/05/1726694.aspx">http://blog.csdn.net/chc05/archive/2007/08/05/1726694.aspx</a>
页:
[1]