自然语言处理2——语言学基础

文章目录

  • 自然语言处理2——语言学基础
    • 词性与词法
    • 短语结构
    • 语义和语用

词性与词法

词性分类:

  • 开放类(词汇类):名词、动词、形容词
  • 封闭类(功能类):介词、限定词等

词法(构词过程):

  • 变形:对词根进行系统的修改,加前后缀来指明语法结构的不同,如:单复数、时态、数目
  • 派生:缺乏系统化,通常导致语法类别及含义的根本变化,如:wide widely
  • 复合:两个以上的词构成一个新词

短语结构

定义:特定的词语集合的行为,在不同位置表现出相同的语法行为。

语法(如何识别短语):

  • 重写规则:类别->类别;左边的符号序列可以重写为右边的符号序列。
  • 树:子节点的顺序为句子中词语的顺序,非终结节点和它的直接子节点/局部树对应重写规则的一个应用,分析树对应句子的派生
  • 带标记的括号:括号集合划出了各成分,并通过加标记表示了非终结符的类别.如:[S[NP[ATThe][NNSchildren]][VP[VBDate][NP[ATthe][NNcake]]]][ S[NP[AT The][NNS children]][VP[VBD ate][NP[AT the][NN cake]]]][S[NP[ATThe][NNSchildren]][VP[VBDate][NP[ATthe][NNcake]]]]

分析:根据句子构建一颗短语结构树

句法分析:给出一个词语序列,重构它的派生或者短语结构树的过程

问题:

  • 远距离依存关系;
  • 句法分析和短语结构歧义:一个词语序列可以给出多个不同的短语结构树;
  • 附着歧义:不同的附着有不同的含义;
  • Garden Pathing:进入可疑分析后不得不回溯重新分析

歧义原因:

  • 语法歧义
  • 找不到对应的句法分析:语法中缺少规则;不合乎语法

语义和语用

语义:研究词语的含义,结构及说话方式:单个词的语义、单个词的含义怎样联合起来组成句子的含义

  • 词汇级语义分析:研究如何理解某个词的含义

    • 词义消歧:某个词有多个含义,如何根据上下文确定含义

      • 方法:基于词典;基于机器学习
    • 词表示:如何表示并学习一个词
      • 方法:one-hot模型;词嵌入(word Embedding:根据词常出现的语境构造向量)
  • 短语级语义分析:词在不同环境下词义会有差别,研究词语搭配的含义
    • 整体含义:各部分含义+不能从各部分推导出的额外的语义信息
  • 句子级语义分析:根据句子的句法结构和其中词的词义等,推导出能够反应这个句子意义的形式化表示
    • 语义角色标注:浅层语义分析方法,任务是找出核心语义角色(人等)和附属语义角色(时间、地点、方式等)
    • 句子嵌入表达:研究句子的向量表示
      • 方法:词袋模型(Bag of word);卷积神经网络;循环神经网络;BERT等

语用:研究知识和语言习惯是如何与字面含义相互影响的,即指人在一定环境中对语言的运用,在不同环境下如何理解语言

  • 篇章分析:阐明文本中句子之间的隐含关系

  • 指代消解:把指代的东西明确化

  • 对话中的语言行为建模

句法、语义、语用的关系:

句法结构相同,语义不同 语义相同,句法结构不同 语义相同,语用有别
例子 ”吃苹果“ ”吃食堂“ ”吃了苹果“ ”苹果吃了“ 主席台上摆着鲜花;鲜花摆在主席台上
相同 句法:动宾结构 语义:动作-对象 语义
不同 语义分别是:动作-对象关系;动作地点关系 句法分别是:动宾关系;主谓关系 1:主席台是旧信息,鲜花是新信息;2:主席台是新信息,鲜花是旧信息

往期文章:
自然语言处理1——NLP概述

自然语言处理2——语言学基础相关推荐

  1. 统计自然语言处理基础-第三章 语言学基础(笔记)

    3 语言学基础 语言学概念+语法(句子结构)现象(附着歧义.短语结构)+词法(词语形成)+语义 3.1 词性和词法 句法=语法类=词性(POS):按照词的语法结构和典型的语义类型分类,类别的名称 开放 ...

  2. 《自然语言处理(哈工大 关毅 64集视频)》学习笔记:第二章 数学基础与语言学基础

    前言 关毅老师,现为哈工大计算机学院语言技术中心教授,博士生导师.通过认真学习了<自然语言处理(哈工大 关毅 64集视频)>1(来自互联网)的课程,受益良多,在此感谢关毅老师的辛勤工作!为 ...

  3. 第二节 数学基础与语言学基础

    数学基础与语言学基础内容: 数学基础:概率论,(从大规模预料中统计较小的语言单位的相关的统计信息,然后运用统计推理技术计算更高一级的语言单位出现的概率) 语言学基础 实用知识 统计自然语言处理的步骤: ...

  4. NLP相关的语言学基础

    前言 自然语言处理是一门融语言学.计算机科学.数学于一体的科学.只会数学和计算机是不够的,本文补充相关的语言学基础. 语言学是以人类语言为研究对象的学科. 探索范围包括语言的性质.功能.结构.运用和历 ...

  5. 南师大考研632c语言,2019南京师范大学外国语言学及应用语言学考研623外国语言文学基础知识与汉语写作与830英语语言学基础知识与翻译考试真题试卷...

    2019南京师范大学外国语言学及应用语言学考研623外国语言文学基础知识与汉语写作与830英语语言学基础知识与翻译考试真题试卷 本复习全析是由仙林南师大考研网依托多年丰富的教学与辅导经验,组织仙林教学 ...

  6. [转]结构主义的语言学基础

    (摘要)结构主义不是一种哲学流派,而是一种哲学运动,是一些社会学家.心理学家.哲学家.文艺评论家和美学家等所共同具有的结构主义的观点和方法的总称.结构主义的理论基础是索绪尔及其后的结构主义语言学加上后 ...

  7. 自然语言处理(2)-信息论基础

    自然语言处理-数学基础 概述 1.信息论基础 1.1熵 1.2 联合熵和条件熵 1.3 相对熵和交叉熵 1.4 互信息和双字耦合度 1.5 噪声信道模型 概述 本系列文章计划总结整理中国科学院大学宗成 ...

  8. 自然语言处理之神经网络基础(四)

    1.1神经网络的基本概念 神经网络(neural network,NN),是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经网络由大量的人工神经元联结进行计算. 前馈神经网络基础 卷积神经网 ...

  9. 自然语言处理之神经网络基础

    1 前馈神经网络   前馈神经网络也称为是深度前馈网络或者多层感知机,它是最基础的深度学习模型. 1.1 基本概念   前馈神经网络的目标是在函数空间中寻找相对正确的函数.函数空间是由所选的archi ...

最新文章

  1. python计时函数_python计时函数
  2. bat maven 一键打包 2.0
  3. 服务器虚拟机进不了暗黑3游戏,暗黑破坏神3无法初始化 D3D的解决方法
  4. LeetCode 45跳跃游戏46全排列
  5. 2016 年 Linux 领域的十大新闻,你有关注吗?
  6. Python基于OpenCV的人脸检测
  7. 【Python】Flask框架系列(一):安装、页面跳转/重定向、模板、逻辑语句、过滤器、继承/使用block、url链接/加载静态资源
  8. 金融计算器 npv_一个工具箱 之 净现值(NPV)计算器
  9. 信息学奥赛一本通(1159:斐波那契数列)
  10. 如何解决 CentOS系统下 使用localhost无法连接数据库
  11. [初识python]使用python给单词表加音标
  12. 随手笔记 -- 时间搜索框,默认搜索4天前至今天
  13. 省考计算机专业课考什么,计算机考研专业课考什么
  14. 中文情感极性词典 NTUSD
  15. 写给新人的话——谈谈应届生入职后应该怎样快速成长
  16. android混淆那些坑
  17. android 自动亮屏解锁,android锁屏唤醒并解锁屏幕
  18. 方正无盘服务器,方正科技改革大学图书馆电子阅览室
  19. Python入门:Python变量和赋值
  20. JVM(Java SE 11版本)加载类和接口

热门文章

  1. python GDAL遥感影像创建缩略图
  2. 胡喜:蚂蚁金服十五年技术架构演进之路
  3. 传智播客网络营销课程大升级,改变从“薪”开始
  4. Tensorflow2.0的简单GCN代码(使用cora数据集)
  5. Retrofit 使用详解
  6. 1.网络通讯-9种常用网络命令
  7. matlab进行傅里叶分析
  8. “Handler中有Loop死循环,为什么没有阻塞主线程,原理是什么?”
  9. 搞不懂DMP是什么?看这里就够
  10. 背景的css代码,CSS网页设计实例:设计制作大背景网页_css