from: http://hi.baidu.com/%BD%F0%C9%DF%BF%F1%CE%E8/blog/item/6a5f41088c5f6a960a7b82d8.html


一. 从古老的甲骨文到今天的汉字,汉字一共有多少个呢? 近年来一直致力于古文字研究的郑州大学博 士生导师王蕴智先生说,他们最新的研究成果表明,商代文字字头已有4100多个,能和今天的字联系起来、仍然“活着”的字有1250多个。中国历来重视编 写出版字书,最早的字书是东汉许慎编撰的《说文解字》,共收汉字9353个,《说文解字》的出现,使汉字书写有了统一的标准和规范。宋代丁度等编纂的《广 韵》,收字达53525个,是古代收汉字最多的字典,清代张玉书奉诏编纂的《康熙字典》,收字达47035个,辛亥革命后,欧阳溥存等编的《中华大字 典》,收入汉字达到48000多个。近年来出版的《汉语大字典》,共收录汉字56000多字,是迄今为止收录汉字最多的字典,堪称当今汉语字典的“世界之 最”

二.你知道有多少使用汉字的国家吗?

除中国使用汉字外,过去使用过或现在仍然在使用汉字的国家有越南、日本、朝鲜、韩国。

越南在公元第一世纪传入汉字。13世纪创造了越南形声字,叫做“字喃”。“字喃”一直与汉字平行使用。19世纪起采用拉丁化新文字。1945年,越南民主共和国成立,用新文字扫除文盲。随着扫盲工作的开展,新文字在越南普及了。

[ 转自铁血社区 http://bbs.tiexue.net/ ]

日本在公元第三世纪传入汉字。不久,日本把汉字当成记音的字母来记录日本语言。后来又把记音字母的汉字笔画简化,创造出 “假名”。到了第七世纪,就出现了汉字夹用“假名”的日文。现在汉字在日文中,只是当作“定型字”来使用,如果有写不出的汉字,也可以直接写假名。一般的 日本人使用的日文,是以假名为主,夹用一部分汉字。汉字曾被限制在1850个,叫做“当用汉字”,另有92个汉字,作为“人名特用字”。1981年3月, 日本国语审议会向文部省申报了所拟订的《常用汉字表》,共有1945字,代替了《当用汉字表》,并于1981年10月公布施行。

朝鲜在公元第二世纪传入汉字,使用汉字约有一千七八百年。1444年,朝鲜颁布推行《训民正音》(李朝世宗皇帝颁布朝鲜 拼音文字时使用的名称),采用汉字笔画式字母,叫“正音字”(即谚文),夹在汉字中间使用。1948年,朝鲜民主主义人民共和国成立,废除了汉字,采用纯 谚文的拼音文字。它的书写单位为字母拼成的方块形式音节。

韩国现在还在使用汉字和韩字(即谚文)的混合体文字,文教部曾经颁布过供大中学校使用的1800个“新订通用汉字”和供一般文字生活使用的1300个“常用汉字”。民间往来的书面语,则因人而异,或用混合体文字,或用纯拼音文字(韩字)。

三.你知道计算机世界的汉字有多少? 最近在互联网上引起的简繁体字之争,引起了IT人对汉字的兴趣。如果从IT人角度来看看这些有趣的方块字,你会发现计算机世界的汉字,比现实中的简繁体还要复杂百倍。

甚么是GB 2312?
GB 2312(或GB 2312-80)是由中国国家标准总局发布的一个中国国家标准的简体汉字字符集,并从1981年5月1日开始实施。全名为《信息交换用汉字编码字符集‧基本集》,又称为GB0。

GB 2312标准共收录6763个汉字,其中一级汉字3755个,二级汉字3008个;同时,GB 2312也收录了682其它字母。GB 2312基本上已可应付计算机处理汉字的需要,覆盖99.75%的使用频率。

甚么是GBK?
基于GB 2312不能处理一些人名、古汉语等罕用字,后来出现了GBK及GB 18030汉字字符集。GBK(Chinese Internal Code Specification)全名为汉字内码扩展规范。

在1993年,Unicode 1.1版本面市,收录了中国、台湾、日本及韩国通用字符集的汉字,总共有2万902个。中文计算机开发商,于是利用了GB 2312未用的编码空间,收录了所有出现在Unicode 1.1及GB 13000.1-93之中的汉字,制定了GBK编码。

根据西方资料,GBK最初是由微软对GB2312的扩展,最初出现于Windows 95简体中文版中,由于Windows在中国广泛被使用,中国国家有关部门将其作为技术规范,但并非中国国家正式标准。

甚么是BIG5?
Big5,又称为大五码或五大码,是使用繁体中文社群中最常用的计算机汉字字符集标准,共收录1万3053个汉字,其中有2字为重复编码。Big5是在 1984年由台湾信息工业策进会和5家(宏碁、神通、佳佳、零壹及大众)共同推动中文计算机文化的公司所共同创立,故称五大码或大五码。

甚么是GB 18030?
中国政府为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB 18030-2000,共收录汉字2万7484个,并强制所有在中国售卖的计算机产品,必须支持这个新的国家标准。

甚么是Unicode?
Unicode(统一码、万国码、单一码)是一种由国际组织设计在计算机上使用的字符编码,能容纳全世界语言文字的编码方案,还可满足跨语言、跨平台进行 文本转换、处理的要求。1990年开始研发,1994年正式公布。最新版本的Unicode是2005年3月31日推出的Unicode 4.1.0。另外,5.0Beta版已于2005年12月12日推出,供会员测试评价至今年5月9日为止。

甚么是UTF?
UTF是Unicode Translation Format的简称,是为了在不同的系统平台上转换Unicode格式,常见的有:UTF-8、UTF-7、UTF-16、UTF-32等。

聂受立 2007.10.25

聂受立:汉字你知多少?相关推荐

  1. 互联网快讯:瑞幸回应价格异常;极米H3S、极米Z6X Pro受用户青睐;知网回应被中科院停用

    国内要闻 "i茅台"App上线19天注册用户突破1000万,共投放25041瓶茅台产品: 知乎回应视频部门裁员超60%传闻:没有裁员计划: 鹏博士携手百度云途腾,为混合云" ...

  2. 融合创新引领,浪擎容灾备份受邀参加日知录企业存储峰会

    11月8日,由日知录社区举办的"展望2018,数据存储新篇章--第二届企业存储峰会"将在北京丽亭华苑酒店举行,浪擎作为中高端行业容灾备份领导者受邀参加,现场将分享数据变革趋势以及浪 ...

  3. c++怎么保存汉字_“的汉字 ”写作练习

    (2020年10月14日,这是某中学高一第一次月考成绩出炉的日子,这是一个意味深长考验家长和学生强大承受力的日子.我在守晚自习,把国庆作业在今晚搞完,此处省略1600个字.) 这次作文的背景:学习完高 ...

  4. 第三方依赖关系的风险:利用数十个易受攻击的 NuGet包瞄准 .NET 平台

     聚焦源代码安全,网罗国内外最新资讯! 编译:奇安信代码卫士 研究人员分析NuGet 仓库上托管的现成可用软件包后指出,51个唯一的软件组件易受多个可活跃利用高危漏洞的影响,再次说明了第三方依赖关系对 ...

  5. 科创人·知乎CTO李大海:技术服务内容、商业化依赖内容,曾被「呵呵」难到挠头

    李大海 知乎合伙人兼CTO 2006年,毕业于北京大学数学科学学院数学系,先后供职于谷歌.云云网和豌豆荚.加盟知乎后,李大海先后负责过广告技术团队.数据.算法和整体社区业务,目前统筹负责知乎大数据团队 ...

  6. 洒扫庭除,恭候佳朋 ——知象光电欢迎广大来宾莅临TCT展会知象展位

    2017年3月8日,TCT亚洲展会将在上海新国际博览中心N5馆盛大开幕,作为本次展会的受邀参展商,知象本次展出的内容包括知象第三代自主扫描技术.独立研发的大部分核心产品,涵盖了知象系列人脸扫描仪.桌面 ...

  7. 常规LED显示屏out!柔性LED显示屏为什么如此受欢迎?

    柔性LED显示屏是一种可以任意弯曲.不损坏的LED显示屏,其电路板是由一种特殊的柔性材料制成,不会被弯曲破坏,随着LED显示行业的快速发展,柔性LED显示屏的生产技术已经成熟,各种定制LED显示屏也可 ...

  8. 修身以俟,顺受其正。

    修身以俟,顺受其正. 知是心之本体,心自然会知:见父自然知孝,见兄自然知弟,见孺子入井自然知恻隐. 大学之道,在明明德,在亲民,在止于至善. 是什么:心即理.一直在说致良知,何谓良知.良知即是心之本体 ...

  9. 量子计算机可以计算葛立恒数,葛立恒数

    葛立恒数曾经被视为在正式数学证明中出现过最大的数,后来则被TREE(3)取代. 中文名 葛立恒数 外文名 Graham's Number性    质 拉姆齐理论问题 发现人 葛立恒 现知下限 12 葛 ...

最新文章

  1. 删除单链表中的重复节点(c语言版本)
  2. 量子计算机 漫画,漫画 | 10分钟看懂量子比特、量子计算和量子算法
  3. 5款非常好用的前端在线编辑器推荐
  4. LINUX使用tcgetattr函数与tcsetattr函数控制终端二
  5. C++ 方块游戏小更新
  6. eureka自我保护机制及配置
  7. 我是这样开始学编程的
  8. java技术专家学习路线图_向Java最佳专家的全球专家学习Java
  9. linux 域账户密码忘记,linux基础命令-用户域用户组管理
  10. java swing 组织机构_课内资源 - 基于Java Swing的小型社团成员管理系统
  11. 9.9递归和动态规划(十二)——小鸡吃米
  12. 数组(有序数组)的公共部分
  13. 基于物联网的工业分析将席卷制造业
  14. 电阻电容封装选择以及电路接地问题
  15. 【君思智慧园区】园区物业管理系统,物业管理系统解决方案
  16. linux用 弹出光驱 cdromeject_sw,Linux_Linux系统下光驱软开关与限速,一、光驱的软开关:eject -r cdro - phpStudy...
  17. 编写一个应用程序,给出“你”“我”“他”在Unicode表中的位置
  18. html表头纵向,网页表格之---多个表格纵向排列
  19. Nlp SBD 文本断句 包含中文 和英文断句
  20. 【每日蓝桥】15、一三年省赛Java组真题“错误票据”

热门文章

  1. [cocos2dx]事件分发机制(一)
  2. python3x版本的保留字总数_Python3.6.5版本的保留字总数是:()-智慧树大数据分析的python基础章节答案...
  3. java postgresql插件_PostgreSQL HLL插件介绍
  4. WaterDrop整体安装流程总结
  5. 关于Vue2中使用vuex,页面不显示内容,控制台报以下错误的问题
  6. css中设置table中的td内容自动换行
  7. 【独立站运营】分享用即上“瘾”的16个购物车召回邮件模板
  8. 汇总一些计算机研究方向的缩写(CNN、RNN、DNN、GNN、GAN、NLP等等)
  9. 实现全链路监控平台很难吗?Pinpoint、SkyWalking、Zipkin 选型对比
  10. 联想网御防火墙内网地址映射不能直接访问临时解决方法