《表象与本质》

最近对自然语言处理(Natural Language Processing, NLP),以及相关的认知科学有了一些新的模模糊糊的想法。

这些想法产生的导火索是一本叫《表象与本质》的书——美国认知科学家侯世达2018年出版的新书:

侯世达是个什么人呢?此人是印第安纳大学文理学院教授(下图左),在上世纪写过一本《歌德埃舍尔与巴赫》——世人简称其为《GEB》,中文名:《集异璧》(下图右)。

凭借此书,侯世达以一人之力打通文学、绘画与音乐之间的次元壁,获得1979年普利策奖。

注:读懂该书需要相当的功力,论逼格比《月亮和六便士》可不知道高到哪里去了。

《表象与本质》是他时隔三十多年之后的又一力作,号称集合了他这些年来在认知科学方面学术研究的一些智慧结晶。

这种级别的作品,不可不期待。那么怎么评价大师的新作呢?

这本书的优点是:观点非常爆炸性和启发性,读完序章和第一章你会觉得整个世界观被刷新了。

主要问题是:实在太啰嗦了。全书800多页,一直在重复性的用各种琐碎的例子佐证他最开始提出的观点。

我读到一半实在撑不住了,哪位同学读完的可以留言告诉我是否后边有更精彩的内容。

基于类比的认知

那么在我读过的内容里,作者抛出了一个怎样惊天动地的观点呢?其实很简单,一句话就能描述:人类认知的一切基础,是类比。

这里先说一下我对“类比”的理解:这里的类比不是文学上的类比,而是作者认为人类认知的基本方式,不是基于符号系统的方式运作(严密的定义,明确的限定条件,公理/定理系统等等),而是场景式的类比。

也就是说,人类的基本认知单元是图像式的、场景式的,这种场景式的认知单元叫做类比

比如:幼儿第一次学会妈妈这个概念,是他意识到一个大人可以叫“妈妈”,“妈妈”这个定义就和大人这个“类比”挂钩了。

但问题随之来了,很可能他对着爸爸也叫“妈妈”。这个时候大人再去纠正他,不对,只有女的才是妈妈。

之后他将前两个类比叠加了起来。但他还是会犯错误,比如管其他的阿姨叫妈妈,然后大人再去纠正。就这样一点一点,“妈妈”这个概念,通过不同类比不断叠加不断修正,在他的脑海中形成。

基于符号系统的认知

那反过来,基于符号系统的认知方式是什么呢?那就是他先学会一个定义:“母亲”代表了养育与教养子女成长的女性。

我们姑且不论人类的认知方式是否是这样的,“母亲”这个定义实际是无法准确定义的,在生物学/社会学/不同文化中都有不同的定义——

  • 一个子女在年幼时候走丢,以至于无法行使养育与教养的母亲算不算母亲?

  • 在生物学上说,如果金星领养了孩子,那金星算不算母亲?

  • 我们有时也会把一些非生物的事物比喻为母亲,比如将祖国称为母亲,那这种说法是不是有问题?

上述例子让我想起一个经典的笑话:

物理学家、天文学家和数学家走在苏格兰高原上,碰巧看到一只黑色的羊。

“啊,”天文学家说道,“原来苏格兰的羊是黑色的。”

“得了吧, 仅凭一次观察你可不能这么说.”物理学家道, “你只能说那只黑色的羊是在苏格兰发现的。”

“也不对,”数学家道, “由这次观察你只能说:在这一时刻, 这只羊, 从我们观察的角度看过去,有一侧表面上是黑色的.”

苏格兰黑山羊:咩?

实际上,对任何一个定义的讨论,都可以这样无限进行下去。

基于类比 vs 基于符号系统

如果人类严格的按照符号系统的方式,按照严格的定义去进行语言的交流,那么一切交流都将停止。

因为任何概念都是需要用无限的维度去定义的,我们可能说的每一句话长度都是无限的。所以人类认知的秘密很可能就如作者所言,是由“类比”组成的。

这也解释了,为什么类比这种方法,在学习过程中如此受欢迎,因为它就是最最符合人类认知规律的方法。

说实话,这种全新的理论真的是颠覆了笔者的世界观,仿佛一个全新的世界出现在眼前!

但有些遗憾的是,作者对这个全新观点的拓展似乎就停留在这个层面了,但很明显这条路无论在认知科学、神经科学、人工智能、甚至是日常交流等等层面,都有很大的拓展空间。


请注意:从此处往下的观点/概念都是笔者自己受书中观点启发产生的新想法,并不严谨,可能只是一些脑洞,甚至并不一定正确,并不存在学术上的探讨空间,主要作用是抛砖引玉。

概念之海与语言采样

概念之海:概念像大海一样,是连续、模糊的,不存在精确定义。

概念在维度上是可以无限扩展,无限细分的。例如前面的对“妈妈”的讨论。

语言采样:如果某一个概念是一个无限维空间中的闭合曲面围成的封闭空间,那其对应的语言就是在这个空间内某几个点的采样——因为概念之海是无限的,大脑不可能将一个概念完全映射,所以发明了“语言”这个东西。

简单到名词,复杂一点到短语,短句,甚至整句话,都是在这个高维度的概念之海中进行采样。

一个单词/短语在某种角度上是一种采样——这恰好符合人工智能中词向量句向量的概念。

强类比弱推理

人类认知和思考的本质是“类比”。一个概念在大脑中的存在的真实形态是一系列类比的集合。

类比的实质对采样点进行主从分析法,提取出最重要的几个特征。这些特征形成了人类对某个概念的认知。

人类也存在用数学符号系统的方式进行思考的能力,但这种能力的速度是极其缓慢的。相比之下,人类使用语言带动类比的方式进行思考的速度是极为快速、高并发的。

人类并没有进化出强大的基于符号系统的推理能力,是因为人类作为一个生物体在现实世界生活的时候极少需要这种符号推理能力。

大家可以想象,即使生活在今天,我们很少会去调用大脑中的逻辑推理能力,绝大部分问题我们使用经验就能搞定了。而所谓的经验其实和类比的认知说的是一码事。

共识与异化

人类的语言在某些时刻有趋同的趋势,比如两个人讨论一个问题,会下意识的进行术语的统一,因为他们期望通过语言达成概念理解的一致性的共识。

但在其他时刻,人类使用语言的时候是趋向异化的,比如一个人写文章,一个词用多了就会求助于另一个词,因为他希望摆脱重复性。

多种描述的一个出发点是智力炫耀,但更重要的是帮助读者在“概念之海”上进行全方位立体的认知(词越多表示采样越多,对概念的描述越清晰)。

语言的本质及对NLP的指引

如果这个理论是正确的,那么再次证明了语言的本质是统计学,连接主义很可能是通向认知秘密的正确道路。BERT的出现说明我们走在了正确的道路上。

如果这个理论是正确的话,那么是否存在一种方法,能让我们对这种基于“类比”的认知方式进行神经网络的构建,也许这是通向通用人工智能的一条路?

当然这是个很深的话题,也远远超出笔者的能力范围了,等笔者有了进一步思考再拿出来和大家分享。

尽职尽才,允公允能 —— 本社群不定期举行线上分享,组织群友分享知识、经验、资源,以达到让我们每个人的职业生涯得到最大程度的发展的目的

欢迎扫面下列二维码关注“悦思悦读”公众微信号

浅论语言与认知的关系 | NLP基础相关推荐

  1. 文本标注十要点 | NLP基础

    NLP基础系列 1. 浅论语言与认知的关系 2. 为什么要处理自然语言 3. 计算机是如何理解自然语言的 文本标注十要点 实验 vs 应用 自然语言处理(NLP)是机器学习领域非常有挑战的一个分支. ...

  2. 计算机与昆虫关系的论文,浅谈昆虫与人类的关系.doc

    浅谈昆虫与人类的关系.doc 浅谈昆虫与人类的关系 班级:生物科学师范 姓名:李杰 学号:2012221107110076 摘要:昆虫为全世界增添光彩,让声音更加多样化,然而随着人类活动的增加,昆虫的 ...

  3. 简述相关与回归分析的关系_浅谈相关分析与回归分析的关系

    浅谈相关分析与回归分析的关系 郝依寒 [期刊名称] <数字通信世界> [年 ( 卷 ), 期] 2018(000)004 [摘要] 本文以回归分析及回归分析的应用为对象做出简要论述 , 通 ...

  4. 安卓Android和Java语言的异同、关系和区别

    安卓Android和Java语言的异同.关系和区别,安卓Android是一种以Linux为基础的开放源码操作系统,主要使用于便携设备.2011年第一季度,安卓在全球的市场份额首次超过塞班系统,跃居全球 ...

  5. 浅论语言文字起源:一个业余人类学家的观察

    翟本瑞 南华大学社会所 学术发展到了一定阶段,无论是在问题意识.研究方法,抑或是在推述命题上,都具有相当的稳定性,形成孔恩(T.Kuhn)所说的「常态科学」.所有的讨论,都在此一固定「典范」中进行,顺 ...

  6. 库函数和c语言的关系,C语言与C语言库函数是什么关系

    C语言与C语言库函数是什么关系 答案:4  信息版本:手机版 解决时间 2020-06-14 13:55 已解决 2020-06-14 07:03 "C语言没有输入输出函数,但通常提供的C系 ...

  7. perl语言与算法的关系

    Perl语言是一种高级动态编程语言,它是一种通用的脚本语言,常用于Web开发.系统管理.网络编程等领域.Perl语言由Larry Wall于1987年开发,它的设计理念是"简单.实用.灵活. ...

  8. 2021秋招-NLP基础任务模型-NER

    NLP基础任务模型-NER 注: 基本全是转载,也都附加了转载链接,侵删. 多谢各位大佬的总结. 目录: 任务定义 简单综述 数据集细节总结 模型细节总结 损失函数计算 总结 NLP实战-中文命名实体 ...

  9. c语言/c++转Java学习笔记---基础问题

    c语言/c++转Java学习笔记---基础问题 1.java注释 2.数组的定义和使用 定义 使用 3.类 4.this 的使用 5.继承 6.super的使用 7.包 8.修饰符 成员的访问控制符( ...

最新文章

  1. php this 代表什么,php中$this-)是什么意思?
  2. 用openMP进行并行加速
  3. MyBatis基础入门《九》ResultMap自动匹配
  4. 欲了解Android Studio,必先知道Gradle
  5. Strings in the Pocket
  6. CCF - 201703-1 - 分蛋糕
  7. LeetCode 1626. 无矛盾的最佳球队(最大上升子序DP)
  8. Linux C语言 文件操作
  9. exchange java对象,【原】Java并发程序的一个应用Exchanger的实例
  10. dubbo全局异常处理_基于spring aop的dubbo异常统一处理
  11. Ubuntu apt update(apt-get update)报错、失败
  12. 为节省内存,动态添加view布局和控件
  13. python3.6.1+selenium3.0环境安装问题及解决方法
  14. 自定义函数求两个整数的绝对差值及排序
  15. 多重序列比对 CLUSTALX
  16. 使用PS蒙版功能去水印以及Word中的图片合并功能合并公司Logo图片
  17. bgp高防-服务器单线、双线、三线、BGP线路哪个更好?
  18. 零基础能学平涂插画么?
  19. 2021.9.15 每日总结
  20. 新税码不显示或者税码被人隐藏,发票校验不显示

热门文章

  1. Linux如何查看显卡版本
  2. Install Burg Bootloader
  3. linux数据库哪个难,11 月数据库排名公布:前三难撼动
  4. 计算机看游戏显卡,如何看电脑显卡性能
  5. 编写宠物dog类python_Python编程:创建和使用类
  6. emp和emn是什么文件,emnemp是什么文件
  7. A fatal exception has occurred.Program will exit。可能是系统装有多个java编程程序。
  8. 大数据在高校的应用场景_大数据在高校教育信息化的应用
  9. 英语NLP词汇类别列表
  10. Sqlmap中代理及其他常用参数