该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

序言

陆俭明

在学术研究领域,袁毓林可以说是一位勤奋的耕耘者。他的论文集《汉语语法研究的认知视野)(商务印书馆)于2004年出版,现在又推出了新的论文集《基于认知的汉语计算语言学研究》。我大略地翻阅了一下全书各篇的内容,论文集的书名“基于认知的汉语计算语言学研究”,点明了该书的基本内容——从认知的视角来研究计算语言学,特别是中文信息处理的问题。正文具体分四部分内容:

第一部分内容,作者取名为“计算理论和语言研究”,包括四篇文章:《计算语言学的理论方法和研究取向》、《基于统计的语言处理模型的有用性和局限性》、《认知科学和汉语计算语言学》和《面向当代科技的语言研究的理论和方法》。计算语言学的研究,大致可以分为两个层面,一个是理论模型的研究,一个是工程研究(或说具体的技术方法研究)。据我所知,袁毓林主要从事理论模型的研究,所以这一部分内容作者主要从宏观的角度介绍说明了计算语言学的理论方法和研究取向;评述了在自然语言处理中已运用过的基于规则和基于统计的两种处理模型,指出处理语言这种复杂的系统“必须走规则和统计相结合的道路”;从认知科学的视角作者把自己认为有价值的并且是可行的计算语言学研究模式介绍给读者,并结合作者自己的研究实践讨论说明了基于认知并面向计算的汉语语法研究的路线;展示了认知语言学和计算语言学相互结合的可能性。这部分内容对有兴趣了解或从事计算语言学研究的人来说,是值得一读的,是很有启迪意义的。

第二部分内容,作者取名为“论元结构和描述框架”,也包括四篇文章:《论元角色的层级关系和语义特征》、《一套汉语动词的论元角色的语法指标》、《汉语谓词的论元结构的描述框架》和《论元结构和句式结构互动的动因、机制和条件——表达精细化对动词配价和句式构造的影响》。袁毓林是我国最早研究配价问题的学者之一,特别是他第一个发表了有关汉语名词配价的研究成果,该成果被广为引用。

以乔姆斯基为代表的生成语法学派所提出的动词论元结构理论与法国依存语法学派特斯尼耶尔提出的动词配价结构理论有相同的一面,当然出发点不同,思考的角度不同,对语言事实解释的广度与深度也不同。十多年来袁毓林一直致力于动词论元结构的研究,在这

方面他发表了一系列有分量的文章。我所主持的两个重大科研项目“面向中文信息处理的现代汉语动词论旨结构系统和汉语词语语义分类层级系统研究”(国务院973国家重点基础研究发展规划项目“图像、语音、自然语言理解与知识挖掘”子课题)和“汉语语义知识的形式化模型及语义分类系统研究”(教育部重点研究基地项目),袁毓林都参加了,其中的“汉语动词的题元系统及其语法指标”(包括“题元的层级体系”,“各别题元的定义、示例和句法语义特点”,“不同题元之间的配合关系”,以及“各别题元的语法指标”)就是由袁毓林执笔起草的。因此本书这一部分内容可以说是他对自己在配价问题和动词论元结构研究方面成果的汇集。在这部分内容中,他不仅建立并提出了汉语动词论元角色的层级体系,定义了各个语义角色,并细致描述了各个语义角色在述谓结构中所表现出来的动态性语义特征,同时通过十个各具特色、有代表性的实例(谓词“切、包1、包2、调查、帮忙1、帮忙2、飞1、飞2、吃、专政”)给出了谓词及其论元的句法配置方式,提出了汉语谓词论元结构的描写框架。更值得注意的是,他探讨了谓词论元结构和句式结构(constructions) 互动的动因、机制和条件,对汉语谓词所谓“变价”和“论元增容”作了进一步的解释。

第三部分内容,作者取名为“信息抽取和语义标注”,包括五篇文章:《信息抽取的语义知识资源研究》、《用动词的论元结构跟事件模板相匹配一-一种由动词驱动的信息抽取方法》、《用逻辑和篇章知识来约束模板匹配——逻辑结构和篇章结构知识在信息抽取中的运用》、《基于论元结构的语义标注的体系和规范》以及《新闻语体真实文本的语义标注的实践》。这部分内容作者主要提出并举例说明了要使计算机有效地自动从真实文本抽取信息,至少要有三种层面的语义知识:话语篇章知识、谓词论元结构知识和句子的逻辑结构知识;为对真实文本进行语义分析和标注,作者细致分析设计了篇章、谓词论元结构、句子逻辑结构这三种层面各自的语义关系,并为这三种层面各自的语义关系设计

并提出了一套可扩充的标记集;作者还以自己设计的这套标记对新闻报道中关于职务调动的真实文本进行了语义关系标注实践。作者标注得相当认真。通过这样的标注实践又有所发现——真实文本中代词或指示词的先行成分(一般称为先行语)常常是隐含的;段落之间的

衔接,其形式手段相当缺乏。这就促使大家去进一步思考、探索怎么为计算机自动处理真实文本解决这方面的难题。

第四部分内容,作者取名为“专题研究和个案分析”,也包括五篇文章:《容器隐喻和套件隐喻及相关的语法现象——词语同现限制的认知解释和计算分析》、《关于分词规范和规范词表的若干意见》、《中文信息处理中的语言难题问答》、《缓冲式移动通信及其发展方向——

一个语言学家的设计思想》和《走向多层面互动的汉语研究》。这部分值得细细阅读的是《容器隐喻和套件隐喻及相关的语法现象――词语同现限制的认知解释和计算分析》和《走向多层面互动的汉语研究》这两篇文章。前一篇文章主要通过对“满”、“全”,特别是“满+NP”、“全+NP”在意义、用法上的不平行性的解释,说明语言中的许多现象只有从认知的隐喻的视角来加以解释——用容器隐喻来解释“满”背后的概念结构以及由“满”构成的“满+NP”的使用特点,用套件隐喻来解释“全”背后的概念结构以及由“全”构成的“全+NP”的使用特点,这样才能说得清楚,说得圓满,说得充分,才能有解释力;通过对“满”和“全”又具有一定的可替换性的解释,说明隐喻分析有必要提升到更为抽象的意象图式水平,这样才更有解释力,才能最终解释说明既然“满”、“全”背后的概念结构是属于不同的隐喻范畴,为什么有时又具有可替换性,即才能说明为什么容器隐喻和套件隐喻在语言的实际使用中会出现二者中和化的现象;更积极的意义,还在于正如作者在文章中所指出的,有助于语言的认知解释有可能实现形式化和可计算,从而有可能实现认知和计算的统一(“有可能”三个字不是作者说的,是我加的)。后一篇文章是作者为徐杰所编的《词汇语法语音的相互关联——第二届肯特岗国际汉语语言学圆桌会议(2002.11.26-30.)论文集》所写的代前言。文章扼要回顾了20世纪汉语研究的历史,对今后的汉语研究发表了很有见地的看法。作者强调指出,汉语研究必须树立“互动观念”,走多层面互动研究之路,而这方面正是目前汉语学界所缺乏的。文章特别谈到了一段时间来成为人们热门话题的所谓“语法研究三个平面”的问题,作者强调指出,“我们不仅应该分清语法的三个不同的平面,而且应该观察这三个不同的平面之间的互动关系”,并应“引入语言类型学的视野”,“引进语法化这种动态性的概念,来审视语法、语义和语用这三个平面之间的互动关系”,“从而打破共时研究和历时研究之间的藩篱,把语言的共时研究和历时研究沟通起来”,以“推动语言研究走向更为全面、综合和多层面互动的道路”。文章以学界已有的研究成果和作者本人的研究成果具体说明了语法和语音之间、词库结构和句法操作之间的互动关系,以及这种互动所应有的限度。这是很有见地的看法,应引起大家重视。

我虽然只粗粗阅读了一遍,觉得收获良多,推荐大家一读。借此机会我也想发表两点看法,同时也想提出一些意见。

北京大学计算机语言学,基于认知的汉语计算语言学研究_袁毓林pdf相关推荐

  1. 南京师范大学计算机控制系统,基于计算机软件控制系统的静电放电研究-南京师范大学学报.PDF...

    基于计算机软件控制系统的静电放电研究-南京师范大学学报 12 2 ( ) Vol. 12 No. 2 第 卷第 期 南京师范大学学报 工程技术版 2012 6 JOURNAL OF NANJING N ...

  2. 用matlab画声波,基于MATLAB的声波分析研究-复旦大学物理教学试验中心.PDF

    基于MATLAB的声波分析研究-复旦大学物理教学试验中心 第 27 卷 第 7 期 实 验 室 研 究 与 探 索 Vol. 27 No. 7 2008年 7 月 RESEARCH AND EXPLO ...

  3. matlab计算空间桁架,基于MATLAB的三维桁架有限元分析_宋志安.pdf

    基于MATLAB的三维桁架有限元分析_宋志安 DOI :10.16452/j.cnki .s kjzk.2010.03.002 29 3 Vol.29 No.3 Journal of Shandong ...

  4. 迈克尔逊干涉计算光强matlab,基于MATLAB方法的非单色光迈克尔逊干涉研究_李芳菊.pdf...

    基于MATLAB方法的非单色光迈克尔逊干涉研究_李芳菊 2012 10 Oct. 2012 年 月 渭南师范学院学报 27 10 Journal of Weinan Normal University ...

  5. 北京大学计算机语言学考博,北京大学中文系语言学及应用语言学考博经验贴(理论语言学)...

    北大中文系博士生招生考试分三个部分:初试.复试.面试.初试为递交材料阶段,通过审核后可以参加复试,也即笔试,笔试之后按比例2:1或1:1进入面试.中文系博士招生名额非常少,按导师录取而不是统一按专业或 ...

  6. 基于python的车辆轨迹研究_基于车牌信息的车辆出行信息分析系统设计——以桂林市为例...

    1. 设计背景与目的 交通调查的主要内容包括出行起讫点调查(OD调查).交通量与交通设施调查.道路通行能力调查等,而进行交通调查需要耗费大量的人力物力,调查过程中各种不确定因素将直接影响调查结果的可信 ...

  7. lisp二次开发 微盘_基于AutoLISP的AutoCAD二次开发研究_郭秀娟.pdf

    2008 年 12 月 Journal of Jilin Architectural and Civil Engineering Institute Dec.2008 基于 AutoLISP 的 Au ...

  8. python web开发框架 支持windows_基于Python的Web开发框架研究_曾浩

    INDUSTRY 计算 机 与 信息 技术 2011 年 8 月 第 8 期 ( 总第 153 期 ) 1 前言 Python 是 一 种开 发 效 率较 高的 语言 , 因此 比较 适 合需求 快 ...

  9. 计算机语言学翁富良,计算语言学导论

    <计算语言学导论>的对象是大学计算机专业.数理统计专业及语言学专业的高年级学生或研究生,与计算语言学有关的科研人员,以及其他有兴趣的读者.如果说纸的发明对人类文明的继承光大有着巨大作用的话 ...

  10. 语料库语言学与计算语言学研究丛书

    转载 冯志伟 "语料库语言学与计算语言学研究丛书" 旨在向国内读者推荐语料库语言学 与计算语言学这两个学科最新和最经典的外文著作. 语料库语言学的语料要建立 在计算机上,而计算语言 ...

最新文章

  1. ETC带火车牌识别设备 多方企业狭路相逢
  2. 学python要多少钱-python学习费用多少合适
  3. BZOJ[1051]受欢迎的牛
  4. Python入门2_之列表元组
  5. [论文写作] vscode + latex
  6. GIF 太大?用 GIFSicle
  7. MVC 《web考勤管理系统》 项目研发文献
  8. oracle 快速检索表名称及包含的字段名称
  9. java来电_java串口 来电显示
  10. 移动地理信息系统学习笔记
  11. 幼儿园体育游戏电子计算机教案,【小班体育活动】_小班体育教案100篇_小班体育游戏活动教案5篇...
  12. 高仿360云盘android端的ui实现,(原创)高仿360云盘android端的UI实现
  13. 大学生“挑战杯”创业计划大赛财务分析估算方法与技巧【转】
  14. UA OPTI544 量子光学1 Maxwell方程与Lorentz Oscillator回顾
  15. 求生之路服务器正在强制此文件的一致性,求生之路2和朋友联机错误代码的解决办法...
  16. CEGUI的使用简单说明
  17. Scrum 4.0(未完待续)
  18. 前端开发之闭包、继承、原型链
  19. 迁移prometheus数据
  20. 截止2022年4月10日,unity5.6-2021(国际版)所有版本下载地址

热门文章

  1. 桌面好看的linux系统,可以当桌面的LINUX漂亮壁纸
  2. 整人网页html语言网站,html愚人节整人一直弹的网页窗口怎么做?
  3. ASP.NET中EnableViewState
  4. 重磅 | 完备的人工智能AI 学习——基础知识学习路线,所有资料免关注免套路直接网盘下载
  5. php 判断是否为中文,php判断是否为中文正则表达式大全
  6. 安装AdventureWorks2008R2
  7. 安装配置管理 之 LumaQQ 的安装和使用
  8. 计算机进管理提示找不到入口,如何解决Win10提示找不到入口点dllregisterserver
  9. 【开源】爬取QQ空间说说及简易数据分析
  10. 爬虫第六篇:scrapy框架爬取某书网整站爬虫爬取