报告上集 | 颠覆中文字的认知范式:从文到字

点击 ↑↑ 上方蓝字,回顾报告上集。

肆○中文字系统运行数据

4.3 追根溯源,精准释义

4.3.3从符号到编码:中文字的根文件

您好,欢迎关注《认文识字——中文字信息精准化》报告。我是安秀。

囿于纸张等物质载体的物理特征局限,历史中,能被纪录下来、流传下来的中文字信息很有限。所幸,借助计算机做往复来回校验,把传衍了几千年的中文字信息给全面打开,如是索迹、真实溯源。

虽然过程有点绕,但毕竟它的根还在,它的“根目录”和“源文件”还是被找出来了。合体为字、独体为文。这132个“文”、就是“字”的根文件,是中文语言最初始最基本的语素、中文语义的最小单位,是承载我们自然语言最核心最基本的单元。如此,我们对中文字的认知,可以从模糊的“表意文字”、还原为可校验的“信息编码”上来。文,是中文字的锚点;从文到字,还原了中文字几千年的传衍脉络;字,是中文语言的锚点;字→词→句→章,呈现了中文自然语言的信息网络。

更进一步,我们再不必只局限在“字典模式”里,用有限的“字形”信息,去“以形释义”的对待中文字、去“望文生义”的解释中文字了;而是可以充分打开它的信息数据,还原到一个个文和字本身的信息内容中,与历史中零散的、碎片的文字信息,与史册里文通理顺的文字信息、和与字典里已成体系的文字信息,盘互交结、相互映照。浩瀚的中文字资源,历历如绘、了了可见。

这已有脉络关系图的10000多个中文字,是包含了【汉字国标码】里7000多个汉字,和《通用规范汉字表》里收录的8105个汉字,可以提供出我们正常当用字的精准释义了。至此,认文识字,轻松掌握。

那,掌握了这些中文字字义信息,用来做什么呢?

伍○你我相关

5.1 中文字的应用和价值

5.1.1中文字不是来源于字典

好。首先,是中文字信息的研究。有三点:

第一点。我们要先明白一个事实:

用来装载中文字的书面、纸张等物质载体,是二维的、扁的,它们只能保存三维信息的二维投影;就跟任何一个具体物件的照片一样,只能提供出二维信息的保存与重现。但我们不要因为装载文字的石碑、纸张等物质载体是“扁”的,就把中文字给“看扁”了。

中文字的字形信息是三维的,是我们的原始意识在客观现象上的映照,是我们“人脑多维智力运行”的结果成像。

中文字早在被编订进字典前、在秦执行“书同文”之前,是百卉千葩、千姿百态的,是我们对同一个事物“多角度、多剖面”的动态描绘,是“同义”、而不同的“像”;把我们心智中的原始意识、认知等三维信息,外化成一元的“形”、动态显象。

这个操作,跟我们现在用“思维导图”来描绘复杂事物的原理,是一样的。一个个初始的“文”,就是一幅幅“思维导图”;融汇一元的“音”,生成出“形、音、义”三元并存的“中文字”来作出表达,并获得了规律性的证实和使用,以此组成出了中文字信息的多维与多元。

人同此心、心同此理。以此特性,中文字得以陪伴我们从原始走到当下、从小群体走到大社会;能跨民族、跨语种,准确地传神倾情、传情达意来达至共识,从而突破了各区域之间的信息壁垒、达至高度融合,支撑起目前世界上使用人数最多的语言的使用运转,在瞬息万变中、活灵活现。

这是第一点:中文字、是超越了二维纸面载体的、三维结果成像,其强大的可塑性,成就了它的多样态、千真万确;同时,以此“三维”特性、而拥有了“与时俱进”的衍生能力,融汇时间延展、层出迭现。中文字,是包含了“空间与时间”的、四维信息并存的独有文字,是目前世界上生命力最强的古文字,朝气蓬勃、生机盎然。

第二点。一般我们会把文字看作是语言的载体;而语言,是承载信息的工具。我们研究文字的语义,通常是研究其语言背后的信息;但中文字、是包含了形和音等、多元多维的信息体,而不仅仅局限于一元的语言信息。

还有,工具决定方法。在“四书五经”之后、在近两千年前,基于物质载体的二维特征,《说文解字》用“平面结构分拆”方式,对已在使用的海量中文字进行“建部分组”,以“部首编排法”进行编订。这种编订方式,非常深刻地影响了后人对中文字的理解和使用;但同时,这种“平面、二维分拆”的方式,衰减了它的三维信息传达,而导致我们当下对中文语义理解,常有“博大有余、精深不足”之虞。此些种种,都是中文字目前的现状。

所以,本着求知求真的理念出发,做中文字信息的研究,就不仅仅限于书法研究、古文字研究等的字形研究,也不仅仅限于语言、语法研究,和释义理解研究等的这些分项中任何一项单项的研究范畴。

它是基于以上“形音义”三方面的综合研究;需要在思维上、突破物质载体的“二维”信息局限,通过多元、多维的信息交互和校正,才能避免偏颇和窄化,获得明确精准的结果。这是属于“信息技术”的研究范畴,需要通过计算机应用来协助完成。

第三点。计算机处理信息,其实是从信息论出发,而并非我们的自然语言;对语言进行识别处理,其实是挖掘其信息的数学模型,是属于“互信息”的校准过程。所以在我看来,中文字的信息研究,是属于“信息技术”的研究范畴,是个数学问题,而不是我们通常理解的语言学问题。

好,我们来简括一下:中文字,是承载了语言背后的信息、由“形音义”等多元多维信息交织而成。我们要突破它一元的、片面的、分裂的研究方式,挖掘其背后的数学模型,通过信息科技技术与原有的范式做交汇融合、来研究分析,始得全息全面。

好,这是关于中文字信息研究方面;我们再来看看它与字母文字的特征比照方面:

5.1.2中文字的多维信息特征

我们的语言是线性的、一维的,依托语言做出的信息表达、也是线性的。当语言被“符号化”了之后,以文字形式,用极其强势的姿态占领了“信息”领域,强烈影响了我们的思考;而文字的呈现方式,也强烈而深刻地影响了我们的思维模式。

但我们的真实世界是立体的、多维的;我们的思考,是基于我们对世界的理解而产生,也是多维的。

以声音语言为依托、只承载了语言信息的字母文字,用其线性逻辑的范式,对多元多维的真实世界做出表达。它的信息表达是不全的,从而导致其对世界的理解和思考也是不全的。

而相对的,中文字在这事情上就有两方面的明显优势了:

第一方面,是在对“思维模式”的表达上。思维模式,顾名思义,就是人对不同维度的信息、进行相关关联来思考的模式,也就是人将不同维度的信息“想而成象”的能力表现。文字表面是语言的载体,其实,是我们的内在思维的外在表现。包含了“全息”特征的中文字,是承载了中文语言的语素和语法逻辑、而形成出的思维模式,是多维组合、交互验证的,是糅合了实证科学与经验哲学的综合呈现。这个特征,在中国人的血亲与姻亲的脉络关系上,和关于生存与生活林林总总的系统运作上,都表现得淋漓尽致,已习惯成自然。

想想我们现在使用的电脑操作系统,从以前的Dos到现在的Windows,也是一个从字符命令交互、到窗口式命令交互,从字符界面、到图形界面的迭代过程。其实,中文字就是“图形命令交互”的综合表达,是能更接近我们人与生俱来的、多元多维思维模式的显象,是比字母文字更丰富而精准、更便捷而明确的全息表达。

第二方面,是在信息使用上。中文字是具有衍生能力的文字,能更灵活、更精准、更丰富地还原我们对真实世界的理解和思考;能更贴合我们的原始意识、承载起我们最自然、最本质的语言表达;其信息密度更大、信息含量和置信度更高;并且,它能够追溯“源文件”、和超越“经验哲学”的这两个特征,可以在“因果科学”上提供出可供验证和复制的“心智能力算法”出来,能够在人工智能的研究和应用上,有更多维的领域突破、和更全面的技术拓展。

5.1.3中文字脉络关系图谱与智能网络

好。将以上中文字信息研究和特征比照、这两项内容做交叠,就明确得出它的应用方向了:

中文字、是一套成熟的文字系统,它以多元、多维的信息方式,支撑着中文字世界良好运行了几千年。但扁平、单一,已经属于过去;立体、灵动,才能走进未来。

曾经,初代AlphaGo的深度学习训练,是用人类的棋谱、和跟人类对弈而积累的。同样的,我们也可以以积淀了几千年的中文字脉络谱为基础,提供出我们人脑多维智力运行的模型出来。

这是中文字132个源出的文,和10600多幅“文和字的属性关系图”,以及随之形成的“中文字延衍脉络关系”大网。这些中文字,都是有独立的【汉字国标码】的,是计算机可以识别的文和字。

文,作为中文字的锚点,让虚拟的文字世界、有了具像和模型;字,作为中文语言的锚点,让纷繁的中文语义、有了表现范畴和可控性。这是我们几千年沉淀下来的“脑图”,以及“脑图交汇”的大网。将这两项特征交叠,就让中文字具有了全球领先的信息能力。这是中文字全新的应用方向。

相对于有限的物质纸张,计算机的数据能力是无限的;相对于无限的计算机数据能力,我们人脑的智力运行是无限无量的。

我希望、与有相关意向和实力的人士合作,以【认文识字】这一万多的中文字矢量信息数据为基础素材,用当今的信息科技技术,把中文字从源出、到传衍、到当下的一整个组织顺序运行,予以动态还原;就像初代的电子地图一样,让它多元、多维的信息体,予以全方位呈现。以此,向社会提供出一套可以连结个体智能、与网络智能相交互的中文智能系统出来,在包括了人工智能领域的各行各业各领域中,做到更迅速、更精准、更自然的信息传收,让中文自然语言的人-机对话、指日可现。

5.2 通晓过去,把握未来

我们的世界,是由物质、能量和信息构成的。我们调动、组织能量的方式,就是我们的文明方式。信息,其实就是指挥和调动能量的要诀;优化组织能力和沟通能力,需要靠信息传收来实现。

中文字,是超越时空的信息能储,能释放出最大量最全面的知识能量。我们可以使用中文字信息精准化运行,让小到各种各类的知识点的出处、和文化溯源,大到包括了生命组织、和社会组织等复杂网络的系统运行,都得以全息涌现。

智能属于机器,智慧属于人人。让我们共同来推动出更丰富、更强大的中文智能系统,扩大我们的认知版图,拓宽它的应用领域;让中文字的本质特性得到更好发挥,深度学习与复杂合作得以尽快实现。谢谢!

后面的详细报告,大概费时90分钟,一共分了三大板块、6个章节来展开。

期待您继续关注。


本文原创首发于 微信公众号 | 版权所有,禁止转载,欢迎转发。

全平台同名 @认文识字 同步更新于 公众号 | 微博 | B站 | CSDN@RenWenShiZi 。

本文部分图片来源于网络,版权归原作者所有。

报告下集 |《认文识字·中文字信息精准化》报告相关推荐

  1. 报告上、下集 |《认文识字●中文字信息精准化》

    您好,欢迎关注<认文识字--中文字信息精准化>报告.我是安秀. 这里说的"中文字",是"中国文字"的简称,也就是我们常说的"汉字" ...

  2. 报告上集 | 《认文识字·中文字信息精准化》报告

    您好,欢迎关注<认文识字--中文字信息精准化>报告.我是安秀. 这里说的"中文字",是"中国文字"的简称,也就是我们常说的"汉字" ...

  3. 《认文识字•简述》【小结】

    你好,我是安秀. 这篇,是<认文识字•简述>的[小结]篇,全长3分钟.我把它独立出来,方便小伙伴们查检. 全篇的内容,请移步到 ↓ <认文识字•简述>https://blog. ...

  4. word文档中文字字符长度不一,如何快速调整使上下行左右对齐

    word文档中文字字符长度不一,如何快速调整使上下行左右对齐 目录 word文档中文字字符长度不一,如何快速调整使上下行左右对齐 1.例如需要将下图文字竖向对齐.(将上一行两个字和下一行四个字上下对齐 ...

  5. Word文档中文字下有红色或绿色波浪线怎么去...

    Word文档中文字下有红色或绿色波浪线怎么去... | 浏览: 8861 | 更新:  2013-04-15 17:29 | 标签: word 13 8 加入杂志 首先大家先了解下Word文档中红色波 ...

  6. Windows系统中Word文档中文字后面的空格下的下划线不显示的解决办法

       笔者最近在做课程设计,需要写Word文档,在写文档的时候遇到了一堆bug,现在课程设计肝完了,终于有时间梳理梳理这些bug然后发布出来做个备忘录.    第一个bug是Windows系统中Wor ...

  7. 为什么文本框里的字只显示一半_Word文档中文字显示不全的解决方法有哪些

    在Word 文档中,如果把段落中的文字字号设置大一点的字体,可能会出现文字显示不全的情况;表格中也可能出现这种情况,文字显示一半或都显示不出来,是什么原因?以下是学习啦小编为您带来的关于Word文档中 ...

  8. 使用VUE实现在table中文字信息超过5个隐藏,鼠标移到时弹窗显示全部

    使用VUE实现在table中文字信息超过5个隐藏,鼠标移到时弹窗显示全部 <template> <div> <table> <tr v-for="i ...

  9. html网页设置边框和底纹在哪,word边框和底纹在哪 word文档中文字的边框与底纹该如何添加...

    我们在使用word的文档的时候,可能会对某些文字进行加边框或者是底纹处理,可是Word如何使用边框和底纹功能呢?今天我们就一起来看一看具体的使用方法和技巧吧. word边框和底纹在哪--word文档中 ...

  10. python之pdfminer:从PDF文档中抽取信息的工具

    pdfminer是一个用于从PDF文档中抽取信息的Python库.它提供了一系列的功能,使我们能够读取和解析PDF文件,并从中提取文本内容.元数据.页面布局和图片等.本文将详细介绍pdfminer库的 ...

最新文章

  1. c语言枚举类型变量的作用
  2. 动态生成控件的消息处理
  3. P4068 [SDOI2016]数字配对
  4. java fx choicebox_JavaFX:具有图像和文本的ChoiceBox
  5. 自我接纳_接纳预测因子
  6. android 自动挂断,[转]android 来电自动接听和自动挂断
  7. android novate乱码,Novate 一款Android RxStyle的网络框架
  8. 鼎信诺审计前端取数工具_给2019前端的5个建议
  9. 【Linux】性能优化-linux命令nicstat 网络性能监控
  10. JS助记 ----- 正则表达式
  11. XDOC云服务API(二)
  12. VC2013 配置属性
  13. 软考中级软件设计师学习资料分享
  14. delphi 操作excel 复选框
  15. 作为学生,我是怎么半年赚到人生第一个三十万的
  16. HTTP协议-python接口自动化话测试(无涯)
  17. 设计模式笔记--访问者模式
  18. BZOJ 1135 [POI2009]Lyz 线段树
  19. 计算机硬件类的相关课程,计算机硬件类课程,hardware course,音标,读音,翻译,英文例句,英语词典...
  20. 转型编程的小伙们们快来拿 python 入门证书!

热门文章

  1. flash一直提示要重新安装,都已经是最新的了,但是还要求更新
  2. win7所有服务被禁用(应该是大多数被禁用)
  3. Taylor Swift - Mean-pdf
  4. python 爱心名字代码_python写心形名字
  5. 引入思考的电影电视动漫
  6. 刀片服务器的显示切换,刀片机服务器切换
  7. Centos7设置开机自动运行脚本
  8. c# wpf 利用截屏键实现截屏功能
  9. 《天涯上令人肝肠寸断的100个签名》
  10. 同时打开多个独立Excel窗口