困难:
中文信息处理所面临的困难如生词识别问题、歧义消解问题等,汉语自动分词问题、词性定义规范问题等。
概念:
1.语言学和语音学
语言由语音、词汇和语法构成。
语音学是研究人类发音特点,特别是语音发音特点,并提出各种语音描述、分类和转写方法的科学。一般有三个分支:发音语音学、听觉语音学和声学语音学。语音学又常称作一般语音学或通用语音学。
2.自然语言处理
NLP也程NLU,
研究内容:
(1)机器翻译:一种语言自动翻译到另一种语言;
(2)自动文摘:自动提取、归纳文档主要内容和含义,形成摘要或缩写;
(3)信息检索、利用计算机系统从海量的文档中找到符合用户需要的相关文档;
(4)文档分类:按照一定的分类标准实现自动归类;
(5)问答系统、信息过滤、信息抽取、文本挖掘、舆情分析
(6)文字编辑和自动校对:对文字拼写、用词,甚至语法、文档格式等进行自动检查、校对和编排。
(7)作文自动评分、光读字符识别、语音识别、文语转换(语音合成)、说话人识别/认证/验证
1.2.2
如果撇开语音学研究的层面, 自然语言处理研究的问题一般会涉及自然语言的形态学、 语法学、 语义学和语用学等几个层次。
形态学:词的内部结构,包括屈折变化和构词法两个部分;
语法学:研究句子结构成分之间的相互关系和组成句子序列的规则;
语义学:研究对象为语言的各级单位,词素、词、词组、句子、句子群、整段文字等;
语用学:

处理方法:
理性主义:在自然语言处理系统中,一般首先由词法分析器按照人编写的词法规则对输入句子的单词进行词法分析,然后,语法分析器根据人设计的语法规则对输入句子进行语法结构分析, 最后再根据一套变换规则将语法结构映射到语义符号(如逻辑表达式、语义网络、中间语言等)。
经验主义:在自然语言处理系统中,一般首先由词法分析器按照人编写的词法
规则对输入句子的单词进行词法分析,然后,语法分析器根据人设计的语法规则对输入句子进行语法结构分析,最后再根据一套变换规则将语法结构映射到语义符号(如逻辑表达式、语义网络、中间语言等)。经验主义的自然语言处理方法是建立在统计方法基础之上的,又称其为统计自然语言处理。需要大量语料库(corpus base)作为基础。

统计自然语言处理(第二版)学习笔记:第一章相关推荐

  1. DirectX 9.0c游戏开发手记之“龙书”第二版学习笔记之1: 开场白

    在开场白之前的说明: 这是"DirectX 9.0c游戏开发手记"的第一部分,叫做"'龙书'第二版学习笔记",讲的是我做"龙书"第二版(原名 ...

  2. 机器人导论(第四版)学习笔记——第一章

    机器人学导论(第四版)学习笔记--第一章 1. 概述 1.1 背景 1.2 操作臂力学和控制 1.3 符号 1. 概述 1.1 背景 工业自动化的发展带来了工业机器人的高速发展.本书聚焦机械臂的力学和 ...

  3. 《Go语言圣经》学习笔记 第一章 Go语言入门

    Go语言圣经学习笔记 第一章 Go语言入门 目录 Hello, World 命令行参数 查找重复的行 GIF动画 获取URL 并发获取多个URL Web服务 本章要点 注:学习<Go语言圣经&g ...

  4. 小吴的《机器学习 周志华》学习笔记 第一章 绪论

    小吴的<机器学习 周志华>学习笔记 第一章 绪论 近一年时间接触到不少机器学习的知识,虽然断断续续学了一些,总感觉还没有入门(只学会了疯狂调包).因此,最近开始系统学习Machine Le ...

  5. 计算机网络学习笔记---第一章

    计算机网络学习笔记 第一章 文章目录 计算机网络学习笔记 第一章 前言 一.计算机网络的概念 (一)计算机网络的功能 1.数据通信(连通性) 2.资源共享(硬件 软件 数据) 3.分布式处理 (Had ...

  6. pdf 天线理论与技术 钟顺时_天线理论与技术第二版-钟顺时-第一章部分习题解答.pdf...

    天线理论与技术第二版-钟顺时-第一章部分习题解答 第一次作业 Matlab 绘制电基本振子方向图和E 面H 面 1 1.1-1 ̅ ( ) ̅ ̅ ∇ × = ∇ × [ ] = − [( )] ̅ ...

  7. 编译原理(龙书)学习笔记 第一章

    编译原理(龙书)学习笔记 第一章 1.1语言处理器 解释器(interpreter) : 编译器(compiler): 一个语言处理系统 练习 1.1.1:编译器和解释器之间的区别 1.1.2:相对优 ...

  8. PhalAPI学习笔记 ——— 第一章自定义HelloWorld接口

    PhalAPI学习笔记 --- 第一章自定义HelloWorld接口 前言 自定义接口 项目实例 结果 分布解析 结束语 前言 公司业务需要转学PHP,而PHP中一个功能强大且生态链完整的PHP接口框 ...

  9. 《谁说菜鸟不会数据分析》学习笔记 第一章总览 第二章数据分析思路

    网上的信息太琐碎了,根本没搞懂什么是数据分析方法什么是数据分析方法论,所以找了一本比较简单的书来系统学习一下,本来打算粗略看完,但是觉得这本书知识还是不错的,所以决定在未来一周把这本书用心学一下. 这 ...

  10. Kotlin学习笔记 第一章开始 第二章 基础

    参考链接 Kotlin官方文档 https://kotlinlang.org/docs/home.html 本系列为参考Kotlin中文文档 https://download.csdn.net/dow ...

最新文章

  1. 高文院士:为什么中国的AI发展必须要有开源开放平台?
  2. MRP区域“MRP Area”的定义以及作用
  3. 作为初学者,应该如何系统学习Java呢?
  4. java定时器克隆方式,Java-DropWizard指标计量器与计时器
  5. python 装饰器(可以接收多个值)
  6. virtualbox display size
  7. 如何彻底搞懂 Java 数据结构?|CSDN 博文精选
  8. mysql 刷新二进制日志_mysql binglog 二进制日志文件
  9. spring 事物配置几种
  10. java 如何将异常_java中的异常处理
  11. Numpy中常用函数
  12. 递归删除文件和删除文件夹
  13. 可靠性工程基础 修订版 课后答案 (刘品)
  14. [MSSQL]SQL简繁转换函数
  15. 嵌入式工具 | 嵌入式开发常用几款的代码编辑器
  16. 利用MATLAB实现对一幅彩色图像的高斯滤波(不采用MATLAB函数)。
  17. 【语音识别】日语语音识别系统Julius(v4.4)的基于DNN的识别(5月8号:识别结果更新)
  18. 褚霸 - Erlang开发实践
  19. 如何将音乐复制到您的Android手机
  20. 图像处理(六)——图像压缩

热门文章

  1. 卡巴斯基病毒库备份小程序
  2. abb变频器dp适配器说明书_ABB变频器ACS510_CN使用说明书.pdf
  3. centos7安装中文字体
  4. Windows 系统:没有远程桌面授权服务器可以提供许可证
  5. 文件传至迅雷服务器,迅雷传输SDK开发文档
  6. 服务器(Windows镜像)自建git服务器超详细教程
  7. 计算机房装修对门的要求,机房建设标准要求
  8. Mac电脑下的单片机开发环境配置心得
  9. 计算机毕业设计:java基于SSM的班级管理系统
  10. 6-3 There is No Free Lunch (40分)