语言是什么呢? 从外在表象上看,语言属于社会和文化中的现象、行为或话语;从内在认知机制上看,语言是人脑的高级认知功能。传统的语言研究主要是在现象层面对语言和言语进行分类、描述。而到了认知神经科学时代,语言可以从行为、认知心理、神经回路、神经元甚至到分子层次加以研究和解释。

传统语义理论——语义三角

1923年,英国学者奥格登(Ogden) 和理查兹(Richards)在著作《意义的意义》(The Meaning of Meaning) 中提出 “语义三角”(semantic triangle) 理论,明确使用“概念”这一术语,主张语言表达式和它所表达的客观事物之间需要由“概念”作为中介。基于此基本思想,即使这一理论历经其发展沿流和理论变迁,都能始终保持同一性。

语义三角理论的整体思想是指符号、概念和所指物三者处于一种相互制约、相互作用的关系之中。它强调语言符号是对事物的指代,指称过程是符号、概念和所指物发生关系的过程。如下图所示,“语义三角”的具体构造传达出以下几点主要思想:

第一,概念或思想(concept/thought) 和所指物(referent/thing) 之间直接联系。概念或思想是在客观事物基础上抽象概括而成的,是客观事物在头脑中的反映。二者用直线连接,表达概念反映客观事物(a concept refers to a thing) 这一思想。

第二,概念与符号或词(symbol/word) 之间同样直接联系。概念通过符号被表达,二者用实线连结,说明符号表达概念( a word symbolizes a concept)这一思想。

第三,符号或词与所指物之间没有直接的、必然的联系,二者之间任意相关,具有约定俗成的性质。虚线说明符号或词代表所指物( a word stands for a referent) 这一思想。语义三角的基本思想在于,符号与所指物之间没有内在的必然联系,真正的联系存在于人的头脑中。

语义三角理论一方面阐明了词语意义发生的过程性,它向人们展示了词语意义的符号化过程以及这一过程的各个成分之间的关系;另一方面,它揭示了影响和左右词语意义化过程中的社会和心理变量;第三,它澄清了人们对词语意义存在于符号之内的惯性错误认识。词语的意义即其概念不是蕴涵在符号内部,而是存在于主体的思想、客体和符号三者之间的联系之中,其意义的真值在于三者的性属及其连接方式。例如像“金山”、“美人鱼”、“凤凰”“独角兽”这样的词,尽管有“意义”,却没有所指称的对象。

人们活动的本质内容就是运用自身的感觉器官和意识器官来感受外部世界,并在自己的内部世界中进行重构。客观事物要进入人脑,人的内部世界才能形成事物印象,并逐步上升为概念。因此,要正确地分析语义、语义形式以及语义与外在事物的关系,还需要深入到脑神经层面,利用尖端技术对产生语言现象和言语行为的神经机制寻求解释。这对于认识并真正把握人类语言机制的运行从而模拟人的语言智能有着重要意义。

认知神经科学——语言理论

国际认知神经科学界的三位学者Michael S. Gazzaniga ,Richard B. Ivry ,George R. Mangun在《认知神经科学——关于心智的生物学》(Cognitive Neuroscience: The Biology of the Mind)一书中,基于理论-实践模型的视角和神经生理学的数据,通过了解单词在大脑中是如何进行表征的,从而推断出大脑如何处理口头和书面输入来获取意义。

单词和概念存储:心理词典

单词表征中的一个中心概念是心理词典(mental lexicon)——关于语义(单词的意义——即概念)、句法(单词是如何组成句子)和词形(拼写和发音模式)信息的心理储存器。

口头和书面语言理解涉及的各成分图示。输入可以经由听觉(口头单词)或视觉(书面单词)通道完成。值得注意的是信息流是自下而上的,从知觉辨识到“较高水平”的单词和词元激活。而语言理解的交互模型预测自上而下加工也有一定的作用。

语言输入的知觉分析

所有关于正常语言理解的模型都必须从单词是如何表征的这个问题开始。然后下一步就是确定什么使人类能够理解语言输入。上图描述了对正常语言理解非常重要的加工过程和表征。

口头语言理解和书面语言理解共享了一些加工过程(即词元和概念激活),但是口头和书面输入还是存在一些明显区别,在早期加工步骤上涉及不同感觉通道的信息输入。当试图理解口头单词时,听者需要解码听觉输入。这种听觉分析的结果被转换成语音编码。实际上这就是听觉词形的词汇表征在心理词典中的贮存过程。这两个加工过程都是前词汇的,不涉及心理词典。当听觉输入被转换成语音格式后,心理词典中最匹配听觉输入的词汇表征就会被选定下来;这个过程被称为词汇选择(lexical selection)。这个被选定的词形进而激活词元(即贮存的语法信息),然后激活词义即概念。

总之,概念或语义表征反映了我们关于真实世界的知识。这些表征可以通过我们的思想和意图或者通过我们对单词和句子、对图片和相片以及对真实世界中事件、物体和状态的感知来被激活。

在不同文化中,一个客观事物有不同的概念或一个概念有不同的客观事物;一个客观事物有多个词汇,如启明星(morning star)、长庚星(evening star)和维纳斯(Venus)都是同一个事物——金星,教师、教员(teacher)。

有些情况下,一个“所指”有两个或两个以上的概念,因为不同的人对同一个事物有不同的理解,尤其是人们跨文化交流的时候表现得更为明显。如英语中的谚语“He is as strong as a horse.”意为“他壮得象头牛”,由此可知,在汉语文化中,当人们比喻某人强壮时,人们头脑中出现的是关于“牛”的认知,而英语文化中出现的是关于“马”的。

事实上也有同样的 symbol 有两个不相关的意思,即语言中的同名异义词。如英文中的“bank  ”有两个词义,一个是“银行”,另一个是“河岸”,属于不同的词,有共同的形式。从词源上看,一个来自 15 世纪的意大利语(banca),一个可追溯到中古英语前的斯堪的纳维亚语。从语义上看,两个词义毫无联系。当人们看到或听到“bank”这个词时,句子的语境影响了多义词“bank”的激活,头脑里产生两个关于它的空间域,由其所处的上下文来决定是它的哪一个词义——金融机构还是河岸。

关于自然语言处理中的语义与概念相关推荐

  1. 哈工大刘挺:自然语言处理中的可解释性问题!

    "知其然,亦知其所以然"是现代计算机科学家针对神经网络可解释性问题追逐努力的方向和梦想.针对自然语言处理中的可解释性问题,哈尔滨工业大学刘挺教授在2022北京智源大会报告中做了详尽 ...

  2. 哈工大刘挺:自然语言处理中的可解释性问题

    "知其然,亦知其所以然"是现代计算机科学家针对神经网络可解释性问题追逐努力的方向和梦想.针对自然语言处理中的可解释性问题,哈尔滨工业大学刘挺教授在近期的报告中做了详尽的解读.首先介 ...

  3. 自然语言处理中的N-Gram模型

    N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的概念,通常在NLP中,人们基于一定的语料库,可以利用N-Gram来预计或者评估一个句子是否合理.另外一方面,N-Gram的另外一个作用是 ...

  4. 《预训练周刊》第19期:歧义短语的类量子语境性研究、自然语言处理中prompt方法的系统综述...

    No.19 智源社区 预训练组 预 训 练 研究 观点 资源 活动 关于周刊 超大规模预训练模型是当前人工智能领域研究的热点,为了帮助研究与工程人员了解这一领域的进展和资讯,智源社区整理了第19期&l ...

  5. 自然语言处理中的Attention Model:是什么以及为什么[二]

    转载自  自然语言处理中的Attention Model:是什么以及为什么[二] 自然语言处理中的Attention Model:是什么以及为什么[二] 1.Attention Model 图一见下: ...

  6. [转]自然语言处理中的Attention Model:是什么及为什么

    自然语言处理中的Attention Model:是什么及为什么 https://blog.csdn.net/malefactor/article/details/50550211 /* 版权声明:可以 ...

  7. 自然语言处理中的语言模型与预训练技术的总结

    目录 0. 背景 1. 统计语言模型(Statistical Language Model) 马尔科夫假设(Markov Assumption) N-Gram模型 拉普拉斯平滑(Laplace Smo ...

  8. 自然语言处理中的Attention Model原理介绍

    原文作者:张俊林 原文地址:自然语言处理中的Attention Model:是什么及为什么 版权声明:转载时请附上原文作者和地址 要是关注深度学习在自然语言处理方面的研究进展,我相信你一定听说过Att ...

  9. 自然语言处理中的迁移学习(上)

    作者:哈工大SCIR 徐啸 来源:Transfer Learning in Natural Language Processing Tutorial (NAACL 2019) 作者:Sebastian ...

最新文章

  1. 如何与您的经理和上层人员进行有效沟通
  2. 华为 connect大会2020_英诺森ProcessGo机器人亮相2019华为CONNECT大会
  3. Docker操作命令详解
  4. mysql in partition_MySQL Partition分区扫盲
  5. java aopalliance-1.0.jar这个包是做什么用的?
  6. 实验二+018+李滨
  7. 美国地名大全(美国城市名称英文 中文)
  8. html5 加入收藏夹,设为首页、添加到收藏夹代码
  9. 扫描仪标准模板滑动采集图像及其处理
  10. 大麦盒子无线服务器连接超时,大麦盒子游戏联网失败怎么办
  11. sl400通过ac无法连接psk加密无线网络
  12. uni-app弹窗多选样式分享
  13. kubeadm更改配置
  14. 桌面上的文件夹怎么保存到计算机硬盘里,电脑文件怎么保存到桌面
  15. 黑客与红客|新手入门渗透测试思路
  16. 【Spring框架】[3/3]AOP,TX,ZJ 基本知识点与总结(思维导图)
  17. Arduino Uno 实验6——LM35温度传感器
  18. android4.2 小红盒,不插电也能用!网红爆款:天猫精灵妙物“小红盒”投影仪评测...
  19. 计算机体系结构 第2章 指令系统的设计(1)
  20. 美国电商是如何用大数据玩转“双十一”的?

热门文章

  1. PC端如何下载B站里面的视频?
  2. Kinect for Unity检测身高方法
  3. java 开发程序IDE
  4. 聊天室登录php,聊天室技术(二)-- 登录_PHP
  5. 有趣的程序代码c语言,一个有趣的小程序
  6. 软件测试丨工具在接口测试中发挥什么样的作用?
  7. QT图表chart-饼状图
  8. 5G和MEC在工业互联网中的应用探讨
  9. 课程笔记《碳中和产业报告》
  10. 《IT学生解惑手册》电子版免费下载!