1960年英格维(Yngve)在《语言结构的模型与假说》中,把人们在构造一个句子时需要存储的最多的符号叫做句子深度(the depth of sentence),对于句子深度,他提出如下的句子深度假说:

①所有的语言都有一个建立在成分基础上的语法;
②在口语中实际使用的句子具有一个深度,在这个深度不能超过一定的符号数;
③这个符号数等于或者近似地等于人们直接记忆的跨度,在心理学上假定为7±2;
④一切语言的语法会采取一定的方法来限制句子的结构,使得大多数的句子不能超过这个深度。
英格维指出,句子的深度不仅与句子中所包含的符号数有关系,而且还跟句子中嵌套结构层次的多少有关系。
例如,下面4个英语句子:
(1)The cat likes tuna fish.
(这只猫喜欢金枪鱼)
(2)The cat the dog chased likes tuna fish.
(狗追赶的这只猫喜欢金枪鱼)
(3)The cat the dog the rat bit chased likes tuna fish.
(老鼠咬的狗追赶的这只猫喜欢金枪鱼)
(4)The cat the dog the rat the elephant admired bit chased likes tuna fish.
(大象羡慕的老鼠咬的狗追赶的这只猫喜欢金枪鱼)
        
       句子(1) 没有嵌套结构,其结构是:
[S'The cat likes tuna fish].
理解起来很容易。
 
句子(2)有一层嵌套结构,其结构是:
 [S'The cat [S'the dog chased] likes tuna fish].
句子(2)深度大于句子(1),理解起来比句子(1)困难。
 
句子(3)有两层嵌套结构,其结构是:
[S'The cat [S'the dog [S'the rat bit] chased] likes tuna fish].
句子(3)深度大于句子(2),理解起比句子(2)困难。
 
句子(4)有三层嵌套结构,其结构是:
[S'The cat [S'the dog [S'the rat [S'the elephant admired] bit] chased] likes tuna fish].
句子(4)深度大于句子(3),理解起来比句子(3)困难。
 
句子中的嵌套结构越多,句子深度就变得越深,理解起来也就更加困难了。
 
在这些嵌套结构的句子中,因为每一个在前面的NP都必须与一个动词相联系,所以,这些句子的形式可以表示如下:
         (the + noun)n (transitive verb)n_1 likes tuna fish.
用A来表示名词组(the + noun),用B来表示及物动词(transitive verb):
                  A = {the cat, the dog, the rat, ...}
                  B = {chased, bit, ...}
         那么,/A* B* likes tuna fish/可表示如下:
                  L = xnyn_1 likes tuna fish,  其中,xÎA, yÎB
这些有多个嵌套层次的复杂句子理解的困难都与句子的深度有关。

英格维提出,人在分析句子时,要使用一个容量有限的栈(stack)来把句法规则存储到栈中,存储的句法规则越多,句子的深度越大,因而句子也就越复杂,理解起来也就越困难。

参考书目
V. Yngve, A model and an hypothesis for language structure. Proceedings of the American Philosophical Society, Vol 104: 444-466, 1960

句子深度假说——冯志伟相关推荐

  1. 计算机语言学家,著名计算语言学家冯志伟为人文学院师生作专题讲座

    (通讯员 乐琦 何伟)4月28日,著名计算语言学家冯志伟先生应邀到访人文学院,为学院师生带来一场题为"词向量与语言学"的学术讲座.讲座通过线下线上方式同时进行.线下讲座由我院何伟副 ...

  2. 大哉,计算语言学之为用!(冯志伟)

    采用计算机技术来研究和处理自然语言是20世纪40年代末期和50年代才开始的,60多年来,这项研究取得了长足的进展,成为了现代语言学中一门重要的新兴学科,叫做"计算语言学"(Comp ...

  3. 《自然语言处理——冯志伟》学习记录(一)

    A. M.  Turning算法计算模型的研究 N. Chomsky形式语言理论的研究 C. E. Shannon概率和信息论模型的研究 结构化数据.非结构化数据 正则表达式 有限自动机:一般我们会用 ...

  4. 乐酷工作室孙志伟:Testin云测试有广度有深度 省钱省力值得信赖

    乐酷工作室孙志伟:Testin云测试有广度有深度 省钱省力值得信赖 2014/10/16 · Testin · 开发者访谈 乐酷工作室是一个专业从事移动终端应用及游戏自主研发和运营的创业团队,目前拥有 ...

  5. 对话湖湘精英会冯志刚:深度结合产业,完整拥抱资本

    孵化器是初创公司成长的摇篮,为初创的中小型企业提供一系列办公服务设施,管理咨询指导,帮助创业团队拉到第一笔投融资. 例如美国的YC培育出了著名新闻网站Reddit.全球最大社交内容共享平台Scribd ...

  6. UCloud裴志伟:最小价值模型,技术迭代与客户需求可以达成平衡

    LiveVideoStack有幸采访了UCloud互联网事业部产品中心总监裴志伟,采访中裴总介绍了UCloud核心产品Rome的前世今生,就网络加速的现状和行业需求进行了深入探讨,表明了对技术和行业的 ...

  7. 阿里巴巴跨物理界招人,世界级音频专家冯津伟入职人工智能团队iDST

    原文链接:点击打开链接 摘要: 11月30日阿里巴巴正式宣布,前Polycom(宝利通)声学设计和信号处理首席工程师(Principal Engineer)冯津伟入职人工智能核心团队iDST,担任智能 ...

  8. 对话钉钉音视频专家冯津伟:大模型不是万能的

    策划:LiveVideoStack 在音视频技术领域,ICASSP 大会是行业的风向标会议,也是语音学界从业者研究下一代技术发展的盛宴.近期,国内外各大企业陆陆续续放出论文入顶会的消息,钉钉蜂鸣鸟音频 ...

  9. 36晋级12第五场:冯志刚决胜入围(节目视频)

    视频地址:[url]http://win.cn.yahoo.com/070613/16/mn53.html[/url] 比赛时间:2007年4月17日 选手:王阳.冯志刚.刘恩霞.王嵩 评委: 熊晓鸽 ...

最新文章

  1. js ajax 递归,javascript ajax循环请求/ 长轮询终极解决办法——递归
  2. Windows7 32位机上,OpenCV中配置GPU操作步骤
  3. web框架总结(django、flask)
  4. 最常用的10个Matlab快捷键,助你编程更高效
  5. Java实例---计算器实例
  6. linux c之解决使用socket函数返回为0的问题
  7. 美团点评APP在移动网络性能优化的实践,通用流行框架大全
  8. Android环境的安装遇到的问题
  9. 诺基亚7原生android,【诺基亚7Plus评测】系统:简洁原生安卓功能却不简单_诺基亚 7 Plus(4GB RAM/全网通)_手机评测-中关村在线...
  10. S5PV210启动过程
  11. python编程循环语句_循环语句—Python编程从入门到精通(5)
  12. 局域网弱口令扫描工具_漏洞扫描软件AWVS的介绍和使用
  13. bash: ./install_software: Permission denied
  14. Java多线程基本概念
  15. 将两个列表转换成字典
  16. Android解析ClassLoader(二)Android中的ClassLoader
  17. Spring Mvc前台访问报404
  18. mysql 避免临时表_MySQL 5.7临时表空间如何玩才能不掉坑里详解
  19. C语言和Python语言有什么区别呢?
  20. 【Masm】使用教程

热门文章

  1. 3570. 【GDKOI2014】壕壕的寒假作业
  2. 步进电机的使用方法和控制方式基本介绍
  3. 前端面试精华帖:100个问题如果你回答出80个,那么请把你的简历给我
  4. 移动机器人学(二)四元数
  5. ffmpeg剪切视频的python小脚本
  6. 安全狗云原生安全能力守护中国联通安全发展
  7. 【转载】如何学习STM32?STM32入门学习经验总结
  8. 探寻平台经济健康发展和垄断规制
  9. IND-CPA(选择明文攻击下的不可区分性)
  10. 林业病虫害数据集介绍