1.2.1计算机中数据的表示

4.汉字编码

汉字处理包括汉字的编码输人、汉字的存储和汉字的输出等环。节。也就是说计算机处理汉字,首先必须先将汉字代码化,即对汉字进行编码。无论西方的拼音文字还是汉字这种象形文字,它们的"意"都寓于它们的"形"和"音"上。前面介绍过,直接向计算机输人文字的字形和语音虽然可以实现,但还不够理想。在计算机内部直接处理,存储文字的字形和语音就更困难了,所以用计算机处理字符,尤其是处理汉字字符,一定要把字符代码化。

西文是拼音文字,基本符号比较少,编码比较容易,而且在一个计算机系统中,输人、内部处理、存储和输出都可以使用同一代码。汉字种类繁多,编码比拼音文字困难,而且在一个汉字处理系统中,输入、内部处理、存储和输出对汉字代码的要求不尽相同,所以用的代码也不尽相同。汉字信息处理系统在处理汉字和词语时,关键的问题是要进行一系列的汉字代码转换。

1)输入码

中文的字数繁多,字形复杂,字音多变,常用汉字就有7000个左右。在计算机系统中使用汉字,首先遇到的问题就是如何把汉字输人到计算机内。为了能直接使用西文标准键盘进行输入,必须为汉字设计相应的编码方法。汉字编码方法主要分为三类:数字编码,拼音码和字形码。

(1)数字编码。数字编码就是用数字串代表一个汉字的输入,常用的是国标区位码。国际区位码将国家标准局公布的6763个两级汉字分成94个区,每个区94位。它实际上把汉字表示成二维数组,区位和位码各为两位十进制数字,因此,输入一个汉字需要按键四次。例如,"中"字位于第54区48位,区位码为5448.

汉字在区位码表中的排列是有规律的。在94个分区中,115区用来表示字母、数字和符号,1687区为一级和二级汉字?一级汉字以汉语拼音为序排列,二级汉字以偏旁部首进行排列。使用区位码方法输人汉字时,必须先在表中査找汉字并找出对应的代码,才能输人。数字编码输人的优点是无重码,而且输入码和内部编码的转换比较方便,但是每个编码都是等长的数字串,代码难以记忆。

(2>拼音码。拼音码是以汉语读音为基础的输入方法。由于汉字同音字太多,输人重码率很髙,因此,按拼音输入后还必须进行同音宇选择,影响了输人速度。

<3)字形编码。字形编码是以汉字的形状确定的编码。汉字总数虽多,但都是由一笔一划组成的,全部汉字的部件和笔划是有限的。因此,把汉字的笔划部件用字母或数字进行编码,按笔划书写的顺序依次输人,就能表示一个汉字。五笔字型、表形码等便是这种编码法。五笔字形编码是最有影响的编码方法。

在计算机系统内部使用的汉子编码是,数据库系统工程师考试汉字编码输入码相关推荐

  1. 汉子编码比字母编码长_字母/博客作者编码问题(使用动态编程)

    汉子编码比字母编码长 Problem statement: 问题陈述: Shivang is a blog writer and he is working on two websites simul ...

  2. php的内部方法编码方式,字符集字符编码以及PHP中的一些转码方法

    在重写一些老的项目的时候,有可能会遇到这种情况 ¾ÍÒµÖ¸µ¼ÖÐÐÄ2010Ä꺮¼Ù·Å¼Ù֪ͨ �����˵�λ������� ???????? 这就是传说中的乱码,要想处理乱码,得先了 ...

  3. 汉子编码比字母编码长_编码比您想象的更具创意

    汉子编码比字母编码长 来自创作背景,当我告诉他们我是全栈开发人员时,人们常常会感到困惑. 似乎数学痴迷的程序员的污名在大多数社交圈中仍然相当突出. 但是,当我解释编码实际上是-非常有创造力时,困惑的表 ...

  4. 2020年中级数据库工程师考试笔记1—计算机系统知识

    第1章 计算机系统知识 1.1 本章考点 1.2 计算机系统基础知识 1.2.1 中央处理单元 1.2.2 数的表示和校验(★★★) 1.3 计算机体系结构 1.3.1 概述 1.3.2 存储系统(★ ...

  5. 15微型计算机系统不包括,全国2002年10月自学考试计算机应用基础真题

    全国2002年10月高等教育自学考试计算机应用基础试题 课程代码:00018 一.单项选择题(本大题共40小题,每小题1分,共40分) 在每小题列出的四个选项中只有一个选项是符合题目要求的,请将正确选 ...

  6. Redis源码-String:Redis String命令、Redis String存储原理、Redis String三种编码类型、Redis字符串SDS源码解析、Redis String应用场景

    Redis源码-String:Redis String命令.Redis String存储原理.Redis String三种编码类型.Redis字符串SDS源码解析.Redis String应用场景 R ...

  7. 计算机考试汉字国际码,计算机一级等级考试_汉字的编码

    (1)某汉字的区位码是2534,它的国际码是(B) A)4563H B)3942H C)3345H D)6566H (2)某汉字的机内码是B0A1H,它的国际码是(B) A)3121H B)3021H ...

  8. 计算机里汉字从输入到输出经过的编码,请描述一个汉字从输入到输出的处理过程。...

    请选B 关于一个汉字从输入到输出处理过程正确的是______. A.首先用汉字的外码将汉字输入,其次用汉字的字形码存储并处理汉字,最后用汉字的内码将汉字输出 B.首先用汉字的外码将汉字输入,其次用汉字 ...

  9. linux windows 字符编码转换,Linux操作系统下汉字编码的转换

    因为项目的需要linux下将GBK编码转换为utf8编码,google一下,网上的相关资源比较少,下面的操作经过本人的反复试验.本例子同样适用于其他的编码转换. 有gbk到utf8的转换过程,需要经过 ...

最新文章

  1. php代码生成txt文件并下载
  2. HTML做3D立体特效,html5 3D立体粒子波浪动画特效代码
  3. java 找不到mysql驱动_java lib目录添加了mysql驱动包,仍然找不到class??
  4. Balluff推出刀具识别系统
  5. apache php并发数,apache查看当前并发数多少
  6. 如果程序跑着跑着就崩溃了,查看内存
  7. lock 线程 java_JAVA多线程-基础Lock Condition 并发集合
  8. 如何在Python中安全地创建嵌套目录
  9. html小游戏代码_研发实践:Mozilla分享如何开发一款WebVR小游戏
  10. linux服务器_Linux 服务器为什么被黑?
  11. 折纸机器人的步骤图解_折纸图解公牛
  12. 【老生谈算法】matlab实现Retinex算法视频增强——Retinex算法
  13. linux命令中tar什么意思,Linux中tar命令起什么作用呢?
  14. Android 2.3应用开发实战
  15. 十月,再见;你好,十一月
  16. 如何通过容器搭建稳定可靠的私有网盘(NextCloud)
  17. Android简单电子书
  18. UnknownError: Failed to get convolution algorithm. This is probably because cuDNN failed to initial
  19. ​危机——疫情是“危”,5G是“机”
  20. LinkedList

热门文章

  1. UE4_Niagara基础3_学习笔记_受击效果制作
  2. RTOS文件系统对比:LittleFS Vs. SPIFFS
  3. 龙之翼java游戏_暗黑骑士团-龙之翼
  4. 阿里云游戏——用云原生和低代码打造边缘计算的元宇宙
  5. QT实现抖音网红表白软件
  6. 学习历程--普中51单片机A2--蜂鸣器实验
  7. faobao_post
  8. unittest总结
  9. Pandas中ix,loc,iloc有什么区别?
  10. 转载:知其所以然(以算法学习为例) 作者: 刘未鹏