很早就有了这个东西,因为一直没学会编写输入法程序,所以就没有拿出来现眼。
方案尽量简化,主要从汉字本身就具备的偏旁部首出发,用偏旁部首的读音的声母字符,按笔画顺序编码即是。

从前不知道,几乎每一个偏旁部首其实都是有读音有含义的。因为怕学五笔,拼音重码又多——那时紫光还没出来,所以想借用Windows中的输入法生成器做一个简单好用的输入法,查阅了康熙字典和汉语大字典,慢慢就研究了起来——呵呵,谈不上“研究”。

既然花了不少心思做出来,现在还是把它放到这里,虽然现在输入法大战基本上都结束了,我的这个方案也没啥特出的,但可能还是有那么一点点的价值吧。——何 况是自己的博客,放啥自己说了算,呵呵 :)  ——如果你真的想要看看这个方案,建议先看下面3张图片,是偏旁部首的部件集,看图片容易一目了然。

就目前我的观点,各方面表现都十分优秀的输入法好像还没有?从汉字人文的角度上看,台湾的仓颉输入法应该是最有意义的——可惜它在内地没有市场。个人认为输入法的使用其实是有潜移默化的作用的,对汉字的拆字编码应该做到合乎文字本身内在的规律才好!

废话少说,拖出小媳妇来......见公婆咯。。。。

字根部件集:(见下面3张图)

====方案重点节录=========================================================================

拆字规律:

  1. 部件规范原则。字中的构字部件不应只取其形似,部件应是按正确的顺序和规范的笔划书写而成的。如“里”字,不应拆为‘田’+ ‘土’,也不应为‘日’+‘土’,而应是‘日’+ ‘丨’+‘二’(当然,前两者可作为容错码);“求”字,应拆为‘一(横)’+‘氺(水)’ +‘丶(点)’,而非‘十’+‘冫’+‘丶’。
  2. 部件取大原则。如部首‘音’,可视为部首‘立’+‘日’,当前者作为构字部件出现时,不可将之拆成后两者。例如“韶”字,应拆为‘音’+‘刀’+‘口’(ydk),而非‘立’+ ‘日’+‘口’(lrk)。
  3. 必拆原则。除单笔划字无法拆分外(如‘乙’),所有字皆必须拆分(例如输入部件字本身时)。如“音”,是一个独自成立的单字,此时应拆为‘立’+‘日’(lr)。
  4. 先成原则。当笔划所归属部件有歧义时,该笔划划归先形成的部件(按字的书写顺序)。如“元”字,既可看为‘二’+‘儿’,亦可看作‘一(横)’+‘兀’,此时按先成原则确定为前者。

取码规则:

  1. 按汉字的正常书写顺序,考虑规范编码和功能划分:
  2. 对单字:取第一、第二和最后一个部件的码元(即部件声母首字符)。若单字取不足三码,可重复取最后一码,也即所有单字都有三码,如“码”字,只有两个码元(sm),但编写码表时取为smm;如“乙”字,可取为ooo。
  3. 对双字词组:取首字首码、首字末码+末字首码、末字末码(即:11+13+21+23)。
  4. 对三字词组:取首字首码+中字首码+末字首码+末字末码(即:11+21+31+33)。
  5. 对四字以上词语:取首字首码+次字首码+第三字首码+第四字首码(即:11+21+31+41)。
  6. 对高频字:取单字首码。
  7. 对快捷双字词:取首字首码+末字首码(11+21)。

容错考虑:

  1. 部件本身可能会出现一字多音,这样,组码时一个字就可能会有多个编码。我们可以以标准读音为主(标准读音是指能代表部件本身 含义的那个字的读音),兼顾其它常用读音作容错考虑。此类部件可属于多个码元。如‘厂’,标准读音为“hǎn”(音罕。《说文》山石之崖巖,人可居。象 形。高鸿缙《中国字例》“厂字本象石岸之形。……”),正常应属于码元‘h’,但简体字中大多将其作为“廠”字的简化字(似忘其本)。作为容错,它也归属 于码元‘c’。
  2. 字的书写顺序不是很明确时(可能源于书法的原因),可适当考虑多种书写方式时的拆字规则。这也会产生字词的 多个编码。如“曹”字,标准书写顺序为12512212511(引自 “金山词霸”中汉语词典资料。1~5分别代表基本笔划“横、竖、撇、点+捺、折+勾”),拆字为‘一’+‘丨’+‘日’(hor),但也可能拆为‘艹’+ ‘曰’+‘日’(cyr或crr。部件‘曰’正属码元‘y’,容错划归于码元‘r’)。
  3. 因单字容错码的存在,故由单字组成的词组和短语也将存在容错的情形(其数量可能不小)。

========================================================================================

【部件集】详细说明图示

字根部件B-M:

字根部件N-Z:

字根部件 aeiouv:

我的汉字输入法编码方案相关推荐

  1. 郑码输入法 编码规则简介 汉字分解

    去找了一本<郑码输入法手册>,然后开始了郑码的学习.这一部分主要是对郑码的基本编码规则做一个了解,然后学习郑码中汉字的分解方式. 一. 认识郑码输入法 1. 简介 郑码输入法是一种较为流行 ...

  2. 计算机常用汉字输入法的使用,计算机的基本操作汉字输入法--.ppt

    第六章 计算机的基本操作 --汉字输入法 6.2 汉字输入法 6.2.1 汉字输入法分类 • 分类:键盘汉字输入编码方案可以归为拼音.字形. 音形三大类. • 1.拼音方案:可以分为全拼音.压缩拼音. ...

  3. 为什么要学习一个适合自己的编码方案

    在我们的生活中,拼音输入法无疑是最人们最常用的一种编码方案,很多人都认为拼音输入法已经很好用了,没有必要再学一个别的输入方法,因此,便有了这篇文章,我将从多个角度来分析我们学习一个更高效的编码方案的好 ...

  4. 汉字编码新尝试:字理组字编码方案v0.0

    综述 众所周知,汉字中的大多数是由偏旁部首(统称为部件)组合出来的. 字理组字,就是按照汉字字理,组合构造出来的字,可以用表里的部件组出任何"讲道理"的字. "这字是啥加 ...

  5. 计算机及编码教案,高中信息技术《文字及其处理技术-汉字的编码》教案

    一.教学目标 1.能够说出汉字的编码方式,知道汉字的处理过程. 2.通过阅读教材.小组合作等方法,认识汉字的不同编码,提升分析问题的能力. 3.通过探究计算机处理汉字的过程,消除计算机处理汉字问题的神 ...

  6. 汉字编码(【Unicode】 【UTF-8】 【Unicode与UTF-8之间的转换】 【汉字 Unicode 编码范围】【中文标点Unicode码】【GBK编码】【批量获取汉字UNICODE码】)

    参考博客: Unicode与UTF-8互转(C语言实现):http://blog.csdn.net/tge7618291/article/details/7599902 汉字 Unicode 编码范围 ...

  7. IME输入法编程:第一章 Windows9x系统下汉字输入法的基本原理

    IME输入法编程 第一章 Windows9x系统下汉字输入法的基本原理 Windows系统下汉字输入法实际上是将输入的标准ascii字符串按照一定的编码规则转换为汉字或汉字串,进 入到目的地. 由于应 ...

  8. Windows9x系统下汉字输入法的基本原理

    Windows9x 系统下汉字输入法的基本原理 Windows 系统下汉字输入法实际上是将输入的标准 ascii 字符串按照一定的编码规则转换为汉字或汉字串,进入到目的地.由于应用程序各不相同,用户不 ...

  9. 汉字GBK编码-------也叫区位码------本人备注

    原文地址::http://www.qqxiuzi.cn/zh/hanzi-gbk-bianma.php 相关文章 1.gbk+unicode+汉字编码对照表----https://wenku.baid ...

最新文章

  1. 国外centos服务器配置epel源
  2. 基于fiddler的网络爬虫校园网自动登陆系统
  3. 小微商 获取平台证书 报错
  4. jquery html data属性,jQuery Mobile Data 属性
  5. ubutun 更换网络源_Ubuntu 更换源
  6. STM32分散加载文件
  7. 图例解析四大UML关系图使用
  8. 参与过上千亿项目的人,账单是何等的惊人?
  9. 326 Power of Three 3的幂
  10. hdu 1007 Quoit Design(最近点对)
  11. CI框架之连接数据库
  12. STM32CubeMX配置读取MLX90614(GY-906)非接触红外测温传感器
  13. 一定要会的Python爬虫技能,搜索名字即可下载全文小说?
  14. 高清青龙壁纸 桌面壁纸
  15. 可视监控对讲、楼宇对讲等领域中的回声消除、音频降噪
  16. 判断当前时间段是否在某个时间段内(当前小时是否在当日某个时间段)
  17. 软考程序员c语言、Java和c++考点
  18. linux上nagios安装完整版
  19. 路漫漫其修远兮:js的成长经历(十二)——jQuery基础
  20. Android Studio页面跳转共享参数

热门文章

  1. 高清图片免费素材网站分享
  2. 教培机构如何搭建在线教育网校平台
  3. vue手动封装分页组件
  4. 写一个能火的游戏视频脚本
  5. ios获取麦克风音频输入数据(PCM)计算DBSPL后与真实值差距很大
  6. numpy的学习,全是源码,勿喷
  7. 适用于iOS的远程桌面软件
  8. php array assoc,PHP array_udiff_assoc 函数
  9. wildfly 21中应用程序的部署
  10. 中小网站运营推广思路