接下来我们探讨人类的自然语言。自然语言起源于口语,我们的探讨主要针对自然语言在视觉符号上的使用——文字。这种选择主要是为了描述上的方便。我们先从英文开始。

一个不懂英文的人对英文书籍进行粗浅的观察会发现:一页一页纸面上从上至下是一行接一行的字符;某些行出现句号后,后面的位置不再书写字符,可区分出或大或小的多个块,我们可称为语块(段落);每一语块的内部由逗号、分号、句号等标点符号分隔成多个段,这里我们称为语段(语句);每一语段内由空格分隔成一串串的字符,我们称为语串(单词);每一语串由相对高频a、b、c、d、e……x、y、z这26个字符(字母)里一个或多个从左到右排列成,偶尔也出现一些其他特殊字符,如拉丁字母或罗马字母。简单地说英文就是26个字母、标点符号、特殊符号、空格以前后排列形成的线性字符流。如果观察者足够耐心,他会发现:有些词很接近,只是开始或结尾处的几个字母不同,如play、played、playing;一些词汇明显不同,但开始结束处几个字母是相同的,如unhappy、unfortunately、unpleasure;同一词汇会在不同的语句出现,比如I have a book与另一句子You have a car中的have,并且所有的词汇都会重复出现;二个语句可能只是某个位置上的词汇不同,其他位置的词汇都相同,比如I have a book与You have a book这二句。

这里所进行的考察、比较与描写,也是传统上语言学家的主要工作,实际的工作要复杂、琐碎、困难得多。早至公元前四世纪古印度人就编写了Pànini语法,对梵语作了在今天看来也是较高水平的描写,包括了派生词、词的屈折变化、复合的规则、句法等的总结。同样的方法被后世的学者继承来研究其他的语种,主要是印欧语系的各语种。在今天我们没有必要自己再去大费周章地进行这类工作,已经有很多现成的总结。基于目前语言学界通常观点,从本书的视角,可对英文进行如下简单说明。

英文底层是基础的视觉构件:26个字母。在此层次这些字母间并无关联,每一个本身是没有内部结构的笔划。在自然语言里除了正好对应一个自由语素(下面会讲到)的情况外,这些字母本身并不能单独应用,即没有意义。

第二个层级是语素,26个字母中的一个或多个按从左至右排列方式组成语素,语素是不可再分解为除字母外其他更基础构成的语言单位。语素可划分为能单独使用的自由语素,也称基础词,如I、a、man、play;不能单独使用的,称为黏附语素,如un、ing、ly、ish、tion。

第三层级是合成词。黏附语素与自由语素组合,或者黏附语素与黏附语素组合,形成可单独使用的合成词。黏附语素与其他成分的组合可进一步细分为派生与屈折。派生产生派生词,如unhappy=un+happy。unhappy实际是与happy不同的一个新词,unhappy与happy语义相反,但它们的语法功用相同:happy能出现的结构位置,unhappy同样能出现,反之亦然。屈折产生的合成词,如working=work+ing。working的语法功用与work不一样:working出现在正在进行时语句的谓语位置,work不能出现在同样时态语句的谓语位置。Working并不被认为是一个新词,屈折变化是用于标识语言单位在数、性、格、时、式以及其他语法意义上的不同。从词的屈折变化可进行词类的划分:名词、动词、形容词、副词、介词等,如后面可以+s表示复数的词就是名词。当然这只是语言学里用来划分词类的一种方法,还存在其他的方法来进行词类划分。词的屈折变化还包括了内部变化的形式,如从sing变化出的sung、sang。复杂还在于,黏附语素的很大一部分即用于派生变化,也用于屈折变化,除这部分共用的黏附语素外,其他黏附语素都只用于派生变化。这些都是词法研究的主要内容。

相关的二个概念是词根与词缀。词根与词缀由不同的分类得到,它们与自由语素与黏附语素的关系较复杂,通常说法是:词根可以对应自由语素,也可以对应黏附语素,或者对应语素的组合;词缀都是黏附语素,黏附语素大部分是词缀,但不全是。构词法经常用词根与词缀来说明,这里就不再重复。

第四个层级是复合词或词组。二个或更多单词可组合为复合词或词组。复合词里参与组合的成分词被认为是固定紧密地组合在一起,在其成分词中间不能插入其他的语言单位。与复合词相比词组里成分词结合的紧密程度要弱些,在其成分词中间可以插入其他的语言单位。书写上词组的各成分间由空格隔开,复合词的成分词可以空格隔开,也可以没有空格或用连字符连接。举例来说blackbird(乌鸦)是一复合词,black bird(黑色的鸟)是一词组。因为结合紧密度上的差异,复合词语法上看作为是与基础词、合成词同级别的语言单位,统称为词;词组则被认为是处于词与句子之间。复合词与词组都由惯用的结构来组合成词,每类结构由二个或更多的构成成分组成,每一成分只能由特定词类,或与此词类相同语法意义的词组来占据。结构的一种划分是:向心结构与离心结构。向心结构中有一个或多个中心词,语法上中心词可以替代整个结构体。只有一个中心词是偏正结构,有多个中心词则为并列结构。离心结构则没有这样的中心词,离心结构最常见的是“施事-动作”的结构,这样的结构有二个构成成分,顾名思义可称为“施事者”与“施事动作”,分别可由主格的名词与有定动词占据,如复合词sunshine。英文里的其他离心结构还包括关系-轴心结构、从属结构等。结构的另一种划分是从词性来进行的,划分的结构有名词性词组(cat nap)、动词性词组(get up)、形容词性词组(good luck)等。复合词与词组所应用的结构大部分是通用的,也有部分只适用于复合词,或只适用于词组。

第五个层级是语句。物理上,语句是由空格隔开的多个词形成的系列,当然,一个词也可能形成一个语句—独词句。语法上,语句可分成多个组成成分。首先是区分出主语与谓语,再从主语与谓语区分出主语、谓语动词、定语、状语、补语等。这种层次分解是最常见的句子成分拆分方式。语句构成成分的不同组合、组合时的不同语序,以及其他方面的特征可将语句细分为不同的句型。语句明细的组成成分会与特定的词类形成对应,典型地如主语对应名词、代词,谓语动词对应动词,定语对应形容词,状语对应副词等。语句的各层次上的构成成分也可以是直接对应某类词组,解释上,词可以是先组合成词组,再组合成语句。一个词组也可以是一个句子,但不能说此时的语句就是词组。第五层次与前四个层次性质上是不一样的,语句是语言表达的实际施行,词、词组为这种实际施行提供素材。一个词作为一个独词句时,虽然与作为词时的形式可能一样,但会多出一种表述性。传统上这种表述性主要是从口语的语调来标识。书写上,一个语句的首字母必须大写,结尾处需附上特定的标点符号,可以把这些也看作表述性的标识。除了表述性外,还会涉及其他的一些变化,比如一个施事-动作结构的词组作为句子时,施事与动作成分分别转换为句子的主语与谓语,这种转换中,原施事成分与动作成分在数、性、格、时态、语态等形态也会发生变化,以保持整个句子的一致性。词组的施事-动作结构可对应至语句的主谓结构,语句的主谓结构主要来源词组的施事-动作结构,但不是所有的语句的主谓结构都源自词组的施事-动作结构,还存在其他一些习惯性的用法。

我们以层次的模型来解释英语的机制,目的是从物理上明确符号媒介的外在形式怎样一步一步地得到更多更复杂的形式,这也是本书的视角所关注的。很容易发现模型失效的地方,比如一个词组可以附加词缀而与一个合成词语法上等效,符号组合时的嵌套使用,还有语句层次的符号也可以简单到一个符号等。虽然如此,更应该注意到的是模型的合理性,平均来说,从第一层次到第五个层次,包含于组合的成分越来越多,对下级单位的组合强度越来越弱,或者说组合越来越多具有动态性。这也符合我们心理上对语言的直觉。

3.2.1对英文考察2相关推荐

  1. 微策略2017年秋招线下笔试+技术面+在线测评+主管面总结

    1 前言 微策略可能在国内的知名度比较小,它是一家总部在美国,在杭州设立研发中心,主要做智能商用软件的外企.更多的信息,请自行搜索. 我是17年10月份面试微策略,然后拿到的开发(前端方向)的offe ...

  2. 在职非全日制计算机考研上岸心得分享

    从考研备考那天开始,到收到了北京交通大学计算机学院的拟录取通知,历时 460 天. 在这一年多的备考日子里,除了掌握了几门考试科目的知识外,更多的是收获了对有关学习.工作.人生问题的新的思考.考研的意 ...

  3. 【校招】【心得】互联网算法岗 / 外企算法岗+开发岗 / 国企券商

    21年秋招-22年春招总结:互联网算法岗.外企算法岗+开发岗.国企券商全方面面试心得 前言 时间一晃而过,眼见着我的读研时光很快就走到了尾声.而我,也在毕业之时,才拿到了春招末班车的offer.回顾自 ...

  4. 系统分析师的意义与职责

    系统分析师的意义与职责 1.能分析用户的需求和约束条件 2.写需求 规格说明书 3.制定项目开发计划 4.协调信息系统开发与运行所涉及的各类人员 5.能苹果核选用适宜的开发工具和方法 6.按标准规范编 ...

  5. 2020软件工程夏令营分享贴

    文章目录 1. 个人基本情况 2. 夏令营情况 3. 预推免情况 4. 夏令营详细过程 5. 预推免详细过程 6. 总结 7.话外 1. 个人基本情况 背景:西安电子科技大学(211) 专业:软件工程 ...

  6. 2023届推免经历分享-四非计算机保研边缘人

    四非边缘人的保研历程 小小的开头 随着28号的系统开放,我接受了西电的拟录取,保研之路也就暂告一段落,其实真正花在准备保研上的时间其实不算长.由于我是院里的第一届学生,而且本科学校确实很一般,所以最后 ...

  7. 刷道谷歌泄漏的面试题:面试官想从中考察你什么?

    这是"谷歌面试题解析"系列的又一篇文章.在这一系列文章中,我介绍了谷歌面试当中经常用到的一些面试题,不过这些面试题已经被泄露,并禁止在面试中使用.不过,我的损失就是你的收获,因为它 ...

  8. Interview:算法岗位面试—10.24下午—上海某软件公司(机器学习,上市)电话面试—考察SVM、逻辑回归、降低过拟合、卷积网络基础等

    Interview:算法岗位面试-10.24下午-上海某软件公司(机器学习,上市)电话面试-考察SVM.逻辑回归.降低过拟合.卷积网络基础等 导读:当时电话来的非常快,我刚做完一家公司的笔试,接着来了 ...

  9. mysql frm 英文全称_FRM考试是中文还是英文?

    FRM(Financial Risk Manager)是全球金融风险管理领域顶级的权威国际资格认证,由美国"全球风险管理协会"(Global Association of Risk ...

最新文章

  1. 卷积神经网络中10大拍案叫绝的操作!
  2. 指定ASP .NET Core Web应用端口
  3. Hadoop大数据零基础高端实战培训系列配文本挖掘项目
  4. redis.conf配置选项如下
  5. NumPy学习笔记(一)
  6. JAVA静态和非静态内部类
  7. charles-无法抓取https包的解决办法及效果
  8. 计算机使用的安全问题,大学计算机基础 教案 了解计算机使用中的安全问题(范文).doc...
  9. Android开发笔记(七十三)代码混淆与反破解
  10. java repl_Java REPL – jshell
  11. unity button 通过事件改变物体颜色
  12. python 车辆识别_PythonAI应用(1)车辆识别
  13. 【Large Scale Adversarial Representation Learning 大规模对抗学习(BigGAN) 】学习笔记
  14. 病毒手动查杀(威金 q盗 熊猫烧香)
  15. 集成运算放大器之积分电路搭建
  16. HDLC协议(一)——基本概念
  17. linux登录界面鼠标键盘失灵,vmware+centos7+启动在登录界面鼠标键盘都不可用
  18. linux快速查找文件
  19. Vue视频播放组件(Video)
  20. Unity3D: 精灵更换图片脚本实现

热门文章

  1. SQLSERVER将子查询数据合并拼接成一个字段
  2. 1003. Universal Travel Sites (35)解题报告
  3. Mac OS X: 如何拆分一个DMG文件(Split/Segmnt DMG file)
  4. 王喆:计算广告技术综述与思考
  5. AC68U koolshare 梅林固件使用IPV6
  6. 平分法及牛顿法求解平方根
  7. (转)大型网站的负载均衡器、db proxy和db
  8. python 决策与控制
  9. 读透《华为数字化转型之道-方法篇》 by 傅一平
  10. python 抓取天涯帖子内容并保存