1,国际码汉字内码是什么

汉字内码是为计算机内部对汉字进行存储、处理的汉字代码,它应能满足存储、处理和传输的要求。当一个汉字输入计算机后就会转换为内码,然后才能在机器内传输、处理。汉字内码的形式也有多种多样。目前,对应于国标码一个汉字也用2个字节存储,并把每个字节的最高二进制位置“1”作为汉字内码的表识,以免与单字节的ASCII码产生歧义性。 汉字的内码也就是汉字的内部码,又称汉字机内码。无论用何种输入码,输入计算机后就立即被转换为机内码进行存储、运算和传送。规则是将国际码的高位字节、低位字节各自加上128(十进制)或80(十六进制)。例如。“中”字的内码以十六进制表示时为D6D0。这样做的目的是使汉字内码区别于西文的ASCII,因为每个西文字母的ASCII的高位均为0,而汉字内码的每个字节的高位均为1。

国际码汉字内码是什么

2,汉字机内码的介绍

汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。
(4020)10->(2814)16+(a0a0)16 =(c8b4)16   汉字机内码、国标码和区位码三者之间的关系为:区位码(十进制)的两个字节分别转换为十六进制后加20h得到对应的国标码;机内码是汉字交换码(国标码)两个字节的最高位分别加1,即汉字交换码(国标码)的两个字节分别加80h得到对应的机内码;区位码(十进制)的两个字节分别转换为十六进制后加a0h得到对应的机内码。   举例:机内码位bedf,求区位码?   有两种解法: 1. bedfh-a0a0h=1e3fh=3063d;   2. bedfh-8080h=3e5fh(国标码),3e5fh-2020h=1e3fh=3063d.

汉字机内码的介绍

3,计算机中汉字机内码与英文ASLl的区别

一个汉字的机内码与国标码之间的差别是前者各字节的最高位二进制值各为1,而后者为0。计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。
国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCIl码发生冲突,于是,汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,因此机内码前后字节最高位都为1。
汉字信息在计算机内部也是以二进制方式存放。由于汉字数量多,用一个字节的128种状态不能全部表示出来,因此在1980年我国颁布的《信息交换用汉字编码字符集——基本集》,即国家标准GB2312-80方案中规定用两个字节的十六位二进制表示一个汉字,每个字节都只使用低7位(与ASCII码相同),即有128×128=16384种状态

计算机中汉字机内码与英文ASLl的区别

4,汉字的计算机机内码就是国标码

首先将区位码转换成国际码,然后将国际码加上8080h,即得机内码。自己总结一下:1.区位码(十进制)转换成区位码(十六进制)。这里要把前两个位换成十六进制,然后后两位换成十六进制。例如,某汉字的区位码是5448,这样把54转换为16进制数36;再把位码48转换为16进制数为30,得到十六进制数3630。2.国际码=区位码(十六进制)+2020h例如,3630h+2020h=5650h得到国标码gb23123.汉字机内码=国际码+8080h机内码就是5650h+8080h=d6d0h记住上面三条,战无不胜!!!呵呵真的
首先将区位码转换成国际码,然后将国际码加上8080h,即得机内码。 自己总结一下: 1.区位码(十进制)转换成区位码(十六进制)。 这里要把前两个位换成十六进制,然后后两位换成十六进制。 例如,某汉字的区位码是5448,这样把54转换为16进制数36;再把位码48转换为16进制数为30,得到十六进制数3630。 2.国际码=区位码(十六进制)+2020h 例如,3630h+2020h=5650h 得到国标码gb2312 3.汉字机内码=国际码+8080h 机内码就是5650h+8080h=d6d0h 记住上面三条,战无不胜!!!呵呵 真的

5,简述汉字区位码国标码和机内码的区别和联系汉字机内码每个字节

输入码、区位码、国标码与机内码输入码、区位码、国标码与机内码,这些字对每一位computer fan 来说,可能都不陌生,但其中的联系与区别,可能就不那么清楚了,(笔者作为一名中专电脑教师,经常遇到同学问类似的问题),下面就这问题讲述一下,以飨读者。我们知道,键盘是当前微机的主要输入设备,;输入码就是使用英文键盘输入汉字时的编码。目前,我国已推出的输入码有数百种,但用户使用较多的约为十几种,按输入码编码的主要依据,大体可分为顺序码、音码、形码、音形码四类,如“保”?字,用全拼,输入码为码为“BAO”,用区位码,输入码为“1703”,用五笔字型则为“WKS”。计算机只识别由0、1组成的代码,ASCII码是英文信息处理的标准编码,汉字信息处理也必须有一个统一的标准编码。我国国家标准局于1981年5月颁布了《信息交换用汉字编码字符集——基本集》,代号为GB2312-80,共对6763个汉字和682个图形字符进行了编码,其编码原则为:汉字用两个字节表示,每个字节用七位码(高位为0),;国家标准将汉字和图形符号排列在一个94行94列的二维代码表中,;每两个字节分别用两位十进制编码,前字节的编码称为区码,后字节的编码称为位码,此即区位码,;如“保”字在二维代码表中处于17区第3位,区位码即为“1703 ”。国标码并不等于区位码,它是由区位码稍作转换得到,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,;这样就得了一个与国标码有一个相对位置差的代码,;再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如:“保”?字的国标码为3123H,它是经过下面的转换得到的:1703D->1103H->+20H->3123H。国标码是汉字信息交换的标准编码,但因其前后字节的最高位为0,与ASCII码发生冲突,如“保”?字,国标码为31H和23H,而西文字符“1”和“#”的SCII也为31H和23H,现假如内存中有两个字节为31H和23H,;这到底是一个汉字?,还是两个西文字符“1”;和“#”?于是就出现了二义性,显然,国标码是不可能在计算机内部直接采用的,于是,;汉字的机内码采用变形国标码,其变换方法为:将国标码的每个字节都加上128,即将两个字节的最高位由0改1,其余7位不变,如:由上面我们知道,“保”字的国标码为3123H,前字节为00110001B,后字节为00100011B,高位改1为10110001B和10100011B 即为B1A3H,因此,?字的机内码就是B1A3H;。显然,汉字机内码的每个字节都大于128,这就解决了与西文字符的ASCII码冲突的问题。如上所述,汉字输入码、区位码、;国标码与机内码都是汉字的编码形式,它们之间有着千丝万缕的联系,但其间的区别也是不容忽视的。

6,什么是汉字的内码外码交换码字形码

1、内码是指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码,通过内码可以达到通用和高效率传输文本的目的。如ASCII。2、外码是相对于内码而言的辞汇。在计算机科学及相关领域中,外码指的是“外在的经过学习之后,可直接了解的编码形式(例如:文字或语音符号)”。中文输入法对汉字的编码即属外码。常见的中文外码有仓颉码、行列码、大易码、呒虾米码、注音码、拼音码。3、交换码是指用于交换文件所使用的编码。对于计算机而言,不同的系统有可能使用不同的内码。但如果不同系统间要交换文件,则会发生乱码现象。解决方法则为,在交换文件前,文件提供者先将由内码形式储存的文件转换成交换码形式再做交换。在接收文件后,文件接收者再由交换码转成内码。4、字形码,点阵代码的一种。为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码(字形码)。用于显示的字库叫显示字库。显示一个汉字一般采用16×16点阵或24×24点阵或48×48点阵。已知汉字点阵的大小,可以计算出存储一个汉字所需占用的字节空间。5、汉字机内码,又称“汉字ASCII码”,简称“内码”,指计算机内部存储,处理加工和传输汉字时所用的由0和1符号组成的代码。输入码被接受后就由汉字操作系统的“输入码转换模块”转换为机内码,与所采用的键盘输入法无关。机内码是汉字最基本的编码,不管是什么汉字系统和汉字输入方法,输入的汉字外码到机器内部都要转换成机内码,才能被存储和进行各种处理。参考资料来源:百度百科-汉字机内码参考资料来源:百度百科-内码参考资料来源:百度百科-外码参考资料来源:百度百科-交换码参考资料来源:百度百科-字形码
内码:指机内码,指计算机汉字系统中使用的二进制字符编码,是沟通输入、输出与系统平台之间的交换码。外码:指输入码,是用来将汉字输入到计算机中的一组键盘符号。常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等 。交换码:指用于交换文件所使用的编码。字形码:是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。通常用16×16点阵来显示汉字。扩展资料:数码:指一个数制中,表示基本数值大小的不同数字符号。如二进制数码为0、1;八进制数码为0、1、2、3、4、5、6、7;十进制数码为0-9共10个数码;十六进制数码为0-9、A-F。国标码:GB2312-80,即汉字信息交换码,主要用于处理不同汉字处理系统或通信系统的信息交换。数字编码:数字编码是用等长的数字串为汉字逐一编号,以这个编号作为汉字的输入码。例如,区位码、电报码等都属于数字编码。拼音码:拼音码是以汉字的读音为基础的输入法。拼音码使用方法简单,一学就会,易于推广,缺点是重码率较高(因汉字同音字多),在输入时常要进行屏幕选字,对输入速度有影响。拼音码是按照汉语拼音编码输入,因此在输入汉字时,要求读音标准,不能使用方言。参考资料来源:百度百科-汉字编码参考资料来源:百度百科-内码参考资料来源:百度百科-交换码
外码
计算机中汉字的表示也是用二进制编码,同样是人为编码的。根据应用目的的不同,汉字编码分为外码、交换码、机内码和字形码。 1.外码(输入码)? 外码也叫输入码,是用来将汉字输入到计算机中的一组键盘符号。英文字母只有26个,可以把所有的字符都放到键盘上,而使用这种办法把所有的汉字都放到键盘上,是不可能的。所以汉字系统需要有自己的输入码体系,使汉字与键盘能建立对应关系。目前常用的输入码有拼音码、五笔字型码、自然码、表形码、认知码、区位码和电报码等,一种好的编码应有编码规则简单、易学好记、操作方便、重码率低、输入速度快等优点,每个人可根据自己的需要进行选择。在后面的章节中,重点介绍智能全拼输入法和五笔字型输入法。? 2.交换码? 计算机内部处理的信息,都是用二进制代码表示的,汉字也不例外。而二进制代码使用起来是不方便的,于是需要采用信息交换码。我国标准总局1981年制定了中华人民共和国国家标准GB2312--80《信息交换用汉字编码字符集--基本集》,即国标码。国标码字符集中收集了常用汉字和图形符号7445个,其中图形符号682个,汉字6763个,按照汉字的使用频度分为两级,第一级为常用汉字3755个,第二级为次常用汉字3008个。为了避开ASCII字符中的不可打印字符0100001--1111110(十六进制为21-7E),国标码表示汉字的范围为2121--7E7E(十六进制)。? 区位码是国标码的另一种表现形式,把国标GB2312--80中的汉字、图形符号组成一个94×94的方阵,分为94个“区”,每区包含94个“位”,其中“区”的序号由01至94,“位”的序号也是从01至94。94个区中位置总数=94×94=8836个,其中7445个汉字和图形字符中的每一个占一个位置后,还剩下1391个空位,这1391个位置空下来保留备用。所以给定“区”值和“位”值,用四位数字就可以确定一个汉字或图形符号,其中前两位是“区”号。后两位是“位”号,如“普”字的区位码是“3853”,“通”字的区位码是“4508”。区位码编码的最大优点是没有重码,但由于编码缺少规律,很难记忆。使用区位码的主要目的是为了输入一些中文符号或无法用其它输入法输入的汉字、制表符以及日语字母、俄语字母、希腊字母等。94个区可以分为五组:?01--15区:是各种图形符号、制表符和一些主要国家的语言字母,其中01--09区为标准符号区,共有682个常用符号。?10--15区:为自定义符号区,可留作用户自己定义。?16--55区:是一级汉字区,共有3755个常用汉字,以拼音为序排列。?56--87区:是二级汉字区,共有3008个次常用汉字,以部首为序排列。? 88--94区:自定义汉字区,可留作用户自己定义。?3.机内码? 根据国标码的规定,每一个汉字都有了确定的二进制代码,但是这个代码在计算机内部处理时会与ASCII码发生冲突,为解决这个问题,把国标码的每一个字节的首位上加1。由于ASCII码只用7位,所以,这个首位上的“1”就可以作为识别汉字代码的标志,计算机在处理到首位是“1”的代码时把它理解为是汉字的信息,在处理到首位是“0”的代码时把它理解为是ASCII码。经过这样处理后的国标码就是机内码。? 汉字的机内码、国际码和区位码之间的关系是:?(汉字机内码前两位)16=(国标码前两位)16+80H=(区码)16+A0H?(汉字机内码后两位)16=(国标码后两位)16+80H=(区码)16+A0H? 把用十六进制表示的机内码的前两位和机内码的后两位连起来,就得到完整的用十六进制表示的机内码。在微机内部汉字代码都用机内码,在磁盘上记录汉字代码也使用机内码。?4.汉字的字形码?字形码是汉字的输出码,输出汉字时都采用图形方式,无论汉字的笔画多少,每个汉字都可以写在同样大小的方块中。为了能准确地表达汉字的字形,对于每一个汉字都有相应的字形码,目前大多数汉字系统中都是以点阵的方式来存储和输出汉字的字形。所谓点阵就是将字符(包括汉字图形)看成一个矩形框内一些横竖排列的点的集合,有笔画的位置用黑点表示,没笔画的位置用白点表示。在计算机中用一组二进制数表示点阵,用0表示白点,用1表示黑点。一般的汉字系统中汉字字形点阵有16×16、24×24、48×48几种,点阵越大对每个汉字的修饰作用就越强,打印质量也就越高。通常用16×16点阵来显示汉字,每一行上的16个点需用两个字节表示,一个16×16点阵的汉字字形码需要2×16=32个字节表示,这32个字节中的信息是汉字的数字化信息,即汉字字模。下面以“口”为例看看16×16点阵字形是怎样存放的(如图3--1)。?如果我们把这个“口”字图形的“.”处用“0”代替,就可以很形象地得到“口”的字形码:0000H 0004H 3FFAH 2004H 2004H 2004H 2004H 2004H 2004H 2004H 2004H 2004H 3FFAH 2004H 0000H 0000H。计算机要输出“口”时,先找到显示字库的首址,根据“口”的机内码经过计算,再去找到“口”的字形码,然后根据字形码(要用二进制)通过字符发生器的控制在屏幕上进行依次扫描,其中二进制代码中是“0”的地方空扫,是“1”的地方扫出亮点,于是就可以得到“口”的字符图形。?字模按构成字模的字体和点阵可分为宋体字模、楷体字模等等,这些是基本字模。基本字模经过放大、缩小、反向、旋转等交换可以得到美术字体,如长体、扁体、粗体、细体等等。汉字还可以分为简体和繁体两种,ASCII字符也可分为半角字符和全角字符。汉字字模按国标码的顺序排列,以二进制文件形式存放在存储器中,构成汉字字模字库,亦称为汉字字形库,称汉字库。???? 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 . . . . . . . . . . . . . . . . 1 . . . . . . . . . . . . . 1 . . 2 . . 1 1 1 1 1 1 1 1 1 1 1 1 . . 3 . . 1 . . . . . . . . . . 1 . . 4 . . 1 . . . . . . . . . . 1 . . 5 . . 1 . . . . . . . . . . 1 . . 6 . . 1 . . . . . . . . . . 1 . . 7 . . 1 . . . . . . . . . . 1 . . 0 . . 1 . . . . . . . . . . 1 . . 1 . . 1 . . . . . . . . . . 1 . . 2 . . 1 . . . . . . . . . . 1 . . 3 . . 1 . . . . . . . . . . 1 . . 4 . . 1 1 1 1 1 1 1 1 1 1 1 1 . . 5 . . 1 . . . . . . . . . . 1 . . 6 . . . . . . . . . . . . . . . . 7 . . . . . . . . . . . . . . . . 图1-6 “口”字的16×16点阵字形图

文章TAG:汉字  机内码  国际  汉字内码  汉字机内码  
下一篇