绪论

一、提出问题

  • 如何让计算机自动或人机互助的完成语言处理功能?
  • 如何让计算机对海量信息进行自动处理、知识挖掘,进行有效利用?

二、基本概念
1、语言学与语音学
语言的两个基本属性:语音、文字
2、语言学:研究语言的学科,包含语言的本质、结构、发展规律
3、语音学:研究发音特点
4、计算机语言学:计算技术和概念、语言学和语音学问题
5、自然语言处理 or 自然语言理解
关于“理解”的标准:计算机智能——表现、反映、人机交互——图灵
测试

三、自然语言处理研究的内容和面对的困难
(一)研究内容

  1. 机器翻译
  2. 自动文摘
  3. 信息检索
  4. 文档分类
  5. 问答系统
  6. 信息过滤
  7. 信息抽取
  8. 文字编辑和自动校对
  9. 光读字符识别OCR
  10. 语音识别
  11. 文本挖掘
  12. 语音识别
  13. 语音合成
  14. 舆情分析
    等等…

(二)自然语言涉及的几个层次
1、形态学
2、语法学:语法规律、句子结构
3、语义学(根本问题):词的含义——句的含义——段落篇章的含义
4、语用学:特定环境的文字用法

(三)面临的困难
1、歧义:语义歧义、结构歧义
eg:Put the block[ in the box on the table].
Put [the block in the box] on the table.
2、未知的语言

四、自然语言处理的基本方法及其发展
(一)基本方法

理性主义 经验主义
知识来源 与生俱来 大量的语言数据
研究对象 语言知识结构、符号、规则 语言数据
理论 Chomsky的语言原则 Shannon的信息论
应用 形式语言 统计模型

(二)发展和现状
1、萌芽期(1946年)——发展期(1966年)——繁荣期(20世纪80年代末)
2、目前已经取得了一定的研究成果,但是根本问题还未解决。
3、新的研究方向不断涌现,具有极大发展前景。

《统计自然语言处理》(宗成庆)学习笔记(一)相关推荐

  1. 《统计学习方法第二版》学习笔记1——概论

    第1章 统计学习及监督学习概率论 目录 第1章 统计学习及监督学习概率论 前言 1 理论部分 1.1 统计学习 1.2 统计学习的分类 1.3 统计学习方法三要素 1.4 模型评估与模型选择 1.5 ...

  2. 深度学习(自然语言处理)Seq2Seq学习笔记(动手实践)

    目录 0. 前言 1. Seq2Seq模型简介 2. 代码复现 2.1 Introduction: 2.2 准备数据: 2.3 训练.验证和测试数据集 2.4 创建Seq2Seq Model 2.4. ...

  3. 《统计学习方法第二版》学习笔记2——感知机

    第2章 感知机 目录 第2章 感知机 前言 1 理论部分 1.1 感知机模型 1.2 感知机学习策略 1.3 感知机算法 1.3.1 原始形式算法 1.3.2 对偶形式算法 2 代码部分 2.1 Pe ...

  4. 《统计学习方法(第二版)》学习笔记 第五章 决策树

    决策树 - ID3.C4.5.CART 对于决策树的学习,无论是ID3.C4.5和CART分类树还是CART回归树,其实都需要重点关注几个点: 数据集确定性的评价指标(信息增益.信息增益比.基尼指数. ...

  5. 深度学习(自然语言处理)Seq2Seq学习笔记(采用GRU且进行信息压缩)(二)

    目录 0 前言: 1 Encoder 2 Decoder 2.1 两种变化: 3 Seq2Seq 模型 3.1 训练Seq2Seq模型 3.2 train 3.4 eval 3.5 实验结果分析:​ ...

  6. 《统计自然语言处理》读书笔记 一.基础知识及概念介绍

    最近准备学习自然语言处理相关的知识,主要参考<统计自然语言处理·宗成庆>和<Natural Language Processing with Python>,推荐大家阅读.第一 ...

  7. 统计自然语言处理梳理二:句法分析

    进行统计自然语言处理系统梳理,学习资料<统计自然语言处理.宗成庆>. 一.概述 句法分析是自然语言处理技术中的关键技术之一,其基本任务是确定句子的句法结构或句子中词汇之间的依存关系. 句法 ...

  8. 统计自然语言处理梳理四:篇章分析

    进行统计自然语言处理系统梳理,学习资料<统计自然语言处理.宗成庆> 篇章分析的最终目标是从整体上理解篇章,最重要的任务是分析篇章结构.篇章结构包括:语义结构,话题结构,指代结构等. 一.基 ...

  9. 学习笔记——条件随机场(基于自然语言和机器学习理解)

    目录 一,条件随机场介绍 1.1啥是词性标注问题? 1.2 机器学习中的生产模型与判别模型 二,基于自然语言处理理解 1 条件随机场(Condition Random Fields),简称CRFs 2 ...

  10. 获取两个数据的交集_Redis学习笔记统计该如何选择数据类型

    关注爱因诗贤每天进步一点点导读 在业务场景中经常需要统计,如某直播累计观看人数.独立访客人数.历史总观看人数等等,再比如要统计某学生某月的签到情况等,遇到统计的情况,就需要思考如何合理地选择 Redi ...

最新文章

  1. Android客户端捕获http请求包的方法
  2. python的六大数据类型中可以改变的数据类型为_Python中数据类型转换
  3. WinCvs 操作参考手册
  4. FTP 主动、被动工作模式
  5. SQL SERVER:SQLDMO库文件的组成
  6. Linux tar将分割的小文件进行合并
  7. GIT项目管理工具(part9)--保存工作区
  8. Android添加单元测试的方法与步骤
  9. AngularJs学习笔记(四)
  10. viewpager 自定义翻页效果_Android RecyclerView自定义LayoutManager
  11. arcgis显示后台错误_死亡、税收和Esri ArcGIS 999999错误:如何修复
  12. MySQL事件的使用
  13. 计算机安全覆盖的内容有哪些,计算机网络的分类有哪些
  14. aix for sqlserver_Oracle大型数据库系统在AIX/UNIX上的实战详解(第2版)(文平)高清PDF扫描版 [266.16M]...
  15. 由四位央行官员为你制作的“数字货币”说明书
  16. nvm npm exit status 1:乱码
  17. 海南计算机管理科员工资,海南公务员级别工资一览表
  18. 自学编程需要注意什么? 1
  19. 小方块上升组成背景特效 html+css+js
  20. 【图像原理】rgb数字图片概念之显示器成像原理

热门文章

  1. [转载]JXTA技术与原型实现简介
  2. 第十二届蓝桥杯模拟赛Python组(第一期)
  3. 程序员干货学习资源(持续更新)
  4. 计算机考苏州公务员考试,苏州公务员考试难度
  5. 【C语言】贪吃蛇游戏
  6. PHP校园食堂系统描述
  7. SQL 数据库基础知识总结(一)
  8. 平安银行java面试_平安银行JAVA笔试题一.doc
  9. 一张图助你了解传统项目管理与敏捷项目管理的区别!
  10. 项目管理学习——PMP 5A高分通过备考经验分享