在计算机内字符,汉字是如何编码的(在计算机内字符,汉字是如何编码的英文)-称心常识网

在计算机内字符，汉字是如何编码的？

在电脑内，汉字的编码分为四种：输入码、国标码、内码和字型码。

输入码：包括拼音编码和字型编码。微软拼音ABC就是拼音编码，五笔字型输入法就是字型编码。

国标码：又称为汉字交换码，在计算机之间交换信息用。用两个字节来表示，每个字节的最高位均为0，因此可以表示的汉字数为2的14次幂，就是16384个。将汉字区位码的高位字节、低位字节各加十进制数32（即十六进制数的20），便得到国标码。例如“中”字的国标码为8680（十进制）或7468（十六进制）。

内码：汉字内码是在设备和信息处理系统内部存储、处理、传输汉字用的代码。无论使用何种输入码，进入计算机后就立即被转换为机内码。规则是将国标码的高位字节、低位字节各自加上128（十进制）或80（十六进制）。例如，“中”字的内码以十六进制表示时应为F4E8。这样做的目的是使汉字内码区别于西文的ASCII，因为每个西文字母的ASCII的高位均为0，而汉字内码的每个字节的高位均为1。

字型码：表示汉字字形的字模数据，因此也称为字模码，是汉字的输出形式。通常用点阵、矢量函数等表示。用点阵表示时，字形码指的就是这个汉字字形点阵的代码。根据输出汉字的要求不同，点阵的多少也不同。简易型汉字为16′16点阵、提高型汉字为24′24点阵、48′48点阵等。如果是24′24点阵，每行24个点就是24个二进制位，存储一行代码需要3个字节。那么，24行共占用3′24=72个字节。计算公式：每行点数/8′行数。依此，对于48′48的点阵，一个汉字字形需要占用的存储空间为48/8′48=6′48=288个字节。

汉字编码包括？

汉字编码

汉字编码（Chinese character encoding ）是为汉字设计的一种便于输入计算机的代码。由于电子计算机现有的输入键盘与英文打字机键盘完全兼容。因而如何输入非拉丁字母的文字（包括汉字）便成了多年来人们研究的课题。汉字信息处理系统一般包括编码、输入、存储、编辑、输出和传输。编码是关键。不解决这个问题，汉字就不能进入计算机。

关关于汉字编码的说法？

汉字的编码体系主要有以下几种：

国标、区位“准国标”国标是将七千余个汉字以及标点符号、外文字母等，排成一个94行、94列的方阵。方阵中每一横行称为一个“区”，每个区有94个“位”。一个汉字在方阵中的坐标，称为该字的区位码；

GBK码，GB码的扩展字符编码，对多达两万多的简繁汉字进行了编码；

BIG5码，针对繁体汉字的汉字编码；

HZ码，HZ码是在Internet上广泛使用的一种汉字编码，它是以“纯国标”的中文与美标码混用为方案；

汉字的编码规则？

汉字编码规则(1980年)一共收录了7445个字符

包括6763个汉字和682个其它符号。

汉字区的内码范围高字节从B0(176)-F7(247)，

低字节从A1(161)-FE(254)，占用的码位是72*94=6768。

其中有5个空位是D7FA-D7FE

汉字编码方法？

计算机中汉字的表示也是用二进制编码，同样是人为编码的。根据应用目的的不同，汉字编码分为外码、交换码、机内码和字形码。

1.外码（输入码）

外码也叫输入码，是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等，一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点，每个人可根据自己的需要进行选择。

2.交换码(国标码)

计算机内部处理的信息，都是用二进制代码表示的，汉字也不例外。而二进制代码使用起来是不方便的，于是需要采用信息交换码。中国标准总局1981年制定了中华人民共和国国家标准GB2312–80《信息交换用汉字编码字符集–基本集》，即国标码。

区位码是国标码的另一种表现形式，把国标GB2312–80中的汉字、图形符号组成一个94×94的方阵，分为94个“区”，每区包含94个“位”，其中“区”的序号由01至94，“位”的序号也是从01至94。94个区中位置总数=94×94=8836个，其中7445个汉字和图形字符中的每一个占一个位置后，还剩下1391个空位，这1391个位置空下来保留备用。

3.机内码

根据国标码的规定，每一个汉字都有了确定的二进制代码，在微机内部汉字代码都用机内码，在磁盘上记录汉字代码也使用机内码。

4.汉字的字形码

字形码是汉字的输出码，输出汉字时都采用图形方式，无论汉字的笔画多少，每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。

5.汉字地址码

汉字地址码是指汉字库中存储汉字字形信息的逻辑地址码。它与汉字内码有着简单的对应关系，以简化内码到地址码的转换

汉字字符编码是？

GB2312编码：1981年5月1日发布的简体中文汉字编码国家标准。GB2312对汉字采用双字节编码，收录7445个图形字符，其中包括6763个汉字。

BIG5编码：台湾地区繁体中文标准字符集，采用双字节编码，共收录13053个中文字，1984年实施。

GBK编码：1995年12月发布的汉字编码国家标准，是对GB2312编码的扩充，对汉字采用双字节编码。GBK字符集共收录21003个汉字，包含国家标准GB13000-1中的全部中日韩汉字，和BIG5编码中的所有汉字。

GB18030编码：2000年3月17日发布的汉字编码国家标准，是对GBK编码的扩充，覆盖中文、日文、朝鲜语和中国少数民族文字，其中收录27484个汉字。GB18030字符集采用单字节、双字节和四字节三种方式对字符编码。兼容GBK和GB2312字符集。

Unicode编码：国际标准字符集，它将世界各种语言的每个字符定义一个唯一的编码，以满足跨语言、跨平台的文本信息转换。

在计算机内字符,汉字是如何编码的(在计算机内字符,汉字是如何编码的英文)