金碧生辉的含义:国标码的概念,特征及其相关信息

来源:百度文库 编辑:高考问答 时间:2024/04/25 02:48:52

国标码简介

??以国家标准局1980年颁布的《信息交换用汉字编码字符集》基本集(代号为GB2312-80)规定的汉字交换码作为国家标准汉字编码。 GB2312-80中共有7445个字符符号:汉字符号6763个,一级汉字3755个(按汉语拼音字母顺序排列),二级汉字3008个(按部首笔划顺序排列),非汉字符号682个。GB2312-80规定,所有的国标码汉字及符号组成一个94×94的方阵。在此方阵中,每一行称为一个“区”,每一列称为一个“位”。这个方阵实际上组成一个有94个区(编号由01到94),每个区有94个位(编号由01到94)的汉字字符集。 一个汉字所在的区号和位号的组合就构成了该汉字的“区位码”。其中,高两位为区号,低两位为位号。这样区位码可以惟一地确定某一汉字或字符;反之,任何一个汉字或符号都对应一个惟一的区位码,没有重码。

区位码分布情况如下:
1区 键盘上没有的各种符号
2区 各种序号
3区 键盘上的各种符号(按中文方式给出)
4-5区 日文字母
6区 希腊字母
7区 俄文字母
8区 标识拼音声调的母音及拼音字母名称
9区 制表符号
10-15区 未用
16-55区 一级汉字(按拼音字母顺序排列)
56-87区 二级汉字(按部首笔划顺序排列)
88-94区 自定义汉字

由上可以看出,所有汉字与符号的94个区,可以分为四个组:
①1-15区:为图形符号区。其中1-9区为标准符号区;10-15区为自定义符号区。
②16-55区:为一级汉字区,包含3755个汉字。这些区中的汉字按汉语拼音顺序排序,同音字按笔画顺序列出。
③56-87区:为二级汉字区,包含3008个汉字。这些区中的汉字是按部首笔划顺序排序的。
④88-94区:为自定义汉字区。

国标码规定,每个汉字(包括非汉字的一些符号)由2字节代码表示。每个字节的最高位为0,只使用低7位,而低7位的编码中又有34个是用于控制的,这样每个字节只有27 - 34 = 94个编码用于汉字。2个字节就有94×94=8836个汉字编码。在表示一个汉字的2个字节中,高字节对应编码表中的行号,称为区号;低字节对应编码表中的列号,称为位号。

汉字国标码的范围用二进制表示是: 00100001 00100001 01111110 01111110 (1+32)10 (1+32)10 (94+32)10 (94+32)10 7位ASCII码是128个字符组成的字符集。其中编码值0 31(00000000 00011111)不对应任何印刷字符,通常称为控制符,用于计算机通信中的通信控制或对计算机设备的功能控制。编码值32(00100000)是空格字符SP。编码值127(1111111)是删除字符DEL。

汉字国标码的起始二进制位置选择00100001即(33)10是为了跳过ASCII码的32个控制字符和空格字符。所以,汉字国标码的高位和低位分别比对应的区位码大(32)10或(00100000)2或(20)H,即: 国标码高位 = 区码 + 20H (H表示十六进制),国标码低位 = 位码 + 20H。