孙悟空生平事迹手抄报:GB18030大字集标准 - 汉字研讨 - 紫光华宇拼音输入法论坛 - Powered b...

来源:百度文库 编辑:偶看新闻 时间:2024/04/30 10:58:25

GB18030大字集标准

  GBK作为行业规范,缺乏足够的强制力,不利于其本身的推广,而GB 13000的实现又脚步缓慢,现有汉字编码字符集标准已经不能满足我国信息化建设的需要。在银行、交通、公安、户政、出版印刷、国土资源管理等行业,对新的、大型的汉字编码字符集标准的要求尤其迫切。
为此,原国家质量技术监督局和信息产业部组织专家制定发布了新的编码字符集标准,GB 18030-2000《信息技术 信息交换用汉字编码字符集 基本集的扩充》。
  GB18030是国家制定的一个强制性大字集标准,全称为GB18030-2000,凡在中国大陆销售的国内外中文电脑,都必须能够处理27533个汉字,否则将不准销售。它的推出使我国港台地区及其他国家使用的汉字集有了一个"大一统"的标准。
  GB18030 是最新的汉字编码字符集国家标准, 向下兼容 GBK 和 GB2312 标准。 GB18030 编码是一二四字节变长编码。一字节部分从 0x0~0x7F 与 ASCII 编码兼容。 二字节部分, 首字节从 0x81~0xFE, 尾字节从 0x40~0x7E 以及 0x80~0xFE, 与 GBK 标准基本兼容。 四字节部分, 第一字节从 0x81~0xFE, 第二字节从 0x30~0x39, 第三和第四字节的范围和前两个字节分别相同。 四字节部分覆盖了从 0x0080 开始, 除去二字节部分已经覆盖的所有 Unicode 3.1 码位。也就是说, GB18030 编码在码位空间上做到了与 Unicode 标准一一对应,这一点与 UTF-8 编码类似。GB 18030总共1587600个码位。GB 18030的编码空间达到了总共23940 + 1587600。它不仅可以收录我们需要的全部汉字,而且还有充足的空间收录我国少数民族文字。在2000年版中,GB 18030收录了ISO/IEC 10646.1: 2000的全部27484个CJK统一汉字,13个表意文字描述符、部分汉字部首和部件、欧元符号。在编码体系上,GB 18030统一了内码和交换码的概念。它完全兼容GB 2312和GBK的编码体系,继承GBK的代码映射表的优点,解决了GB 18030和GB 13000之间的代码转换。