《统计自然语言处理》(宗成庆)学习笔记(一)
绪论
一、提出问题
- 如何让计算机自动或人机互助的完成语言处理功能?
- 如何让计算机对海量信息进行自动处理、知识挖掘,进行有效利用?
二、基本概念
1、语言学与语音学
语言的两个基本属性:语音、文字
2、语言学:研究语言的学科,包含语言的本质、结构、发展规律
3、语音学:研究发音特点
4、计算机语言学:计算技术和概念、语言学和语音学问题
5、自然语言处理 or 自然语言理解
关于“理解”的标准:计算机智能——表现、反映、人机交互——图灵
测试
三、自然语言处理研究的内容和面对的困难
(一)研究内容
- 机器翻译
- 自动文摘
- 信息检索
- 文档分类
- 问答系统
- 信息过滤
- 信息抽取
- 文字编辑和自动校对
- 光读字符识别OCR
- 语音识别
- 文本挖掘
- 语音识别
- 语音合成
- 舆情分析
等等…
(二)自然语言涉及的几个层次
1、形态学
2、语法学:语法规律、句子结构
3、语义学(根本问题):词的含义——句的含义——段落篇章的含义
4、语用学:特定环境的文字用法
(三)面临的困难
1、歧义:语义歧义、结构歧义
eg:Put the block[ in the box on the table].
Put [the block in the box] on the table.
2、未知的语言
四、自然语言处理的基本方法及其发展
(一)基本方法
理性主义 | 经验主义 | |
---|---|---|
知识来源 | 与生俱来 | 大量的语言数据 |
研究对象 | 语言知识结构、符号、规则 | 语言数据 |
理论 | Chomsky的语言原则 | Shannon的信息论 |
应用 | 形式语言 | 统计模型 |
(二)发展和现状
1、萌芽期(1946年)——发展期(1966年)——繁荣期(20世纪80年代末)
2、目前已经取得了一定的研究成果,但是根本问题还未解决。
3、新的研究方向不断涌现,具有极大发展前景。
《统计自然语言处理》(宗成庆)学习笔记(一)相关推荐
- 《统计学习方法第二版》学习笔记1——概论
第1章 统计学习及监督学习概率论 目录 第1章 统计学习及监督学习概率论 前言 1 理论部分 1.1 统计学习 1.2 统计学习的分类 1.3 统计学习方法三要素 1.4 模型评估与模型选择 1.5 ...
- 深度学习(自然语言处理)Seq2Seq学习笔记(动手实践)
目录 0. 前言 1. Seq2Seq模型简介 2. 代码复现 2.1 Introduction: 2.2 准备数据: 2.3 训练.验证和测试数据集 2.4 创建Seq2Seq Model 2.4. ...
- 《统计学习方法第二版》学习笔记2——感知机
第2章 感知机 目录 第2章 感知机 前言 1 理论部分 1.1 感知机模型 1.2 感知机学习策略 1.3 感知机算法 1.3.1 原始形式算法 1.3.2 对偶形式算法 2 代码部分 2.1 Pe ...
- 《统计学习方法(第二版)》学习笔记 第五章 决策树
决策树 - ID3.C4.5.CART 对于决策树的学习,无论是ID3.C4.5和CART分类树还是CART回归树,其实都需要重点关注几个点: 数据集确定性的评价指标(信息增益.信息增益比.基尼指数. ...
- 深度学习(自然语言处理)Seq2Seq学习笔记(采用GRU且进行信息压缩)(二)
目录 0 前言: 1 Encoder 2 Decoder 2.1 两种变化: 3 Seq2Seq 模型 3.1 训练Seq2Seq模型 3.2 train 3.4 eval 3.5 实验结果分析: ...
- 《统计自然语言处理》读书笔记 一.基础知识及概念介绍
最近准备学习自然语言处理相关的知识,主要参考<统计自然语言处理·宗成庆>和<Natural Language Processing with Python>,推荐大家阅读.第一 ...
- 统计自然语言处理梳理二:句法分析
进行统计自然语言处理系统梳理,学习资料<统计自然语言处理.宗成庆>. 一.概述 句法分析是自然语言处理技术中的关键技术之一,其基本任务是确定句子的句法结构或句子中词汇之间的依存关系. 句法 ...
- 统计自然语言处理梳理四:篇章分析
进行统计自然语言处理系统梳理,学习资料<统计自然语言处理.宗成庆> 篇章分析的最终目标是从整体上理解篇章,最重要的任务是分析篇章结构.篇章结构包括:语义结构,话题结构,指代结构等. 一.基 ...
- 学习笔记——条件随机场(基于自然语言和机器学习理解)
目录 一,条件随机场介绍 1.1啥是词性标注问题? 1.2 机器学习中的生产模型与判别模型 二,基于自然语言处理理解 1 条件随机场(Condition Random Fields),简称CRFs 2 ...
- 获取两个数据的交集_Redis学习笔记统计该如何选择数据类型
关注爱因诗贤每天进步一点点导读 在业务场景中经常需要统计,如某直播累计观看人数.独立访客人数.历史总观看人数等等,再比如要统计某学生某月的签到情况等,遇到统计的情况,就需要思考如何合理地选择 Redi ...
最新文章
- Android客户端捕获http请求包的方法
- python的六大数据类型中可以改变的数据类型为_Python中数据类型转换
- WinCvs 操作参考手册
- FTP 主动、被动工作模式
- SQL SERVER:SQLDMO库文件的组成
- Linux tar将分割的小文件进行合并
- GIT项目管理工具(part9)--保存工作区
- Android添加单元测试的方法与步骤
- AngularJs学习笔记(四)
- viewpager 自定义翻页效果_Android RecyclerView自定义LayoutManager
- arcgis显示后台错误_死亡、税收和Esri ArcGIS 999999错误:如何修复
- MySQL事件的使用
- 计算机安全覆盖的内容有哪些,计算机网络的分类有哪些
- aix for sqlserver_Oracle大型数据库系统在AIX/UNIX上的实战详解(第2版)(文平)高清PDF扫描版 [266.16M]...
- 由四位央行官员为你制作的“数字货币”说明书
- nvm npm exit status 1:乱码
- 海南计算机管理科员工资,海南公务员级别工资一览表
- 自学编程需要注意什么? 1
- 小方块上升组成背景特效 html+css+js
- 【图像原理】rgb数字图片概念之显示器成像原理