自然语言处理:背景和概述
Natural Language Processing:Background and Overview
作者:Regina Barzilay(MIT,EECS Department,September 8, 2004)
译者:我爱自然语言处理(www.52nlp.cn ,2009年1月5日)

四、 这门课程将包含哪些内容(What will this course be about)?
1、 对不同层次(句法、语义、篇章)的语言知识建立合适的计算模型和有效的表达方式(Computationally suitable and expressive representation of linguistic knowledge at various levels: syntax, semantics, discourse)
2、 从文本样本中学习有关语言特性的算法:平滑估计,对数线性模型,概率上下文无关文法,EM算法,联合训练,…..(Algorithms for learning language properties from text samples: smoothed estimation, log-linear models, probabilistic context free grammars, the EM algorithm, co-training, …)
3、 以文本处理技术为基础的应用:机器翻译,文本摘要,信息检索(Technologies underlying text processing applications: machine translation, text summarization, information retrieval)

五、 教学大纲(Syllabus)
 简介和概述(Introduction and Overview)——1课时(1 class)
 简单的语言统计学(Simple Language Statistics)——1课时(1 class)
 语言模型(Language Models)——1课时(1 class)
 标注(Tagging)——1课时(1 class)
 句法分析(Syntactic Parsing)——1课时(1 class)
 无监督语法归纳(Unsupervised Grammar Induction )——1课时(1 class)
 词汇语义学介绍(Introduction to Lexical Semantics)——1课时(1 class)
 词义消歧(Word Sense Disambiguation)——1课时(1 class)
 语义分析(Semantic Parsing)——1课时(1 class)
 语篇处理介绍(Discourse Processing)——1课时(1 class)
 指代消解(Anaphora Resolution)——1课时(1 class)
 主题划分(Topical Segmentation)——1课时(1 class)
 语篇分析(Discourse Parsing)——1课时(1 class)
 对话处理(Dialogue Processing)——1课时(1 class)
 自然语言生成(Natural Language Generation)——1课时(1 class)
 文本摘要(Text Summarization)——1课时(1 class)
 信息检索(Information Retrieval)——1课时 (1 class)
 机器翻译(Machine Translation)——3课时 (3 classes)

六、 预备知识(Prerequisites)
1、 对语言感兴趣并了解英语的基本知识(Interest in language and basic knowledge of English)
2、 懂一些基本的线性代数,概率统计知识(Some basic linear algebra, probability and statistics)
3、 有基本的编程基础(Some programming skills)

七、 评价(Assessment)
1、 期中考试(Midterm)——35%
2、 两个家庭作业(Two homeworks)——每个15%
3、 一个提交工程(Project)—— 35%

八、 总结(Summary)
1、 统计方法 vs “手工制作”系统(Statistical approaches vs. hand-crafted systems)
 a) 许多规则都需要编码成人类知识(Many rules are required to encode human knowledge)
 b) 很难对规则间的交互建模(Hard to model rule interaction)
 c) 常见的限制比较弹性(Frequently constraints are soft)
2、 关于NLP的机器学习(Machine Learning for NLP)
 a) 我们需要对语言信息更有效的计算表示能力(We need computationally effective representation of linguistic information)
 b) 我们需要对处理语言数据更合适的学习算法(We need new learning algorithms suitable for processing linguistic data)

下一讲(Next lecture):单词计数(Word Counting)

第一讲结束!
第二讲:单词计数

 附:课程及课件pdf下载MIT英文网页地址:
   http://people.csail.mit.edu/regina/6881/

注:本文遵照麻省理工学院开放式课程创作共享规范翻译发布,转载请注明出处“我爱自然语言处理”:www.52nlp.cn

from:http://www.52nlp.cn/mit-nlp-first-lesson-introduction-and-overview-third-part/

MIT自然语言处理第一讲:简介和概述(第三部分)相关推荐

  1. MIT自然语言处理第一讲:简介和概述(第二部分)

    自然语言处理:背景和概述 Natural Language Processing:Background and Overview 作者:Regina Barzilay(MIT,EECS Departm ...

  2. MIT自然语言处理第一讲:简介和概述(第一部分)

    自然语言处理:背景和概述 Natural Language Processing:Background and Overview 作者:Regina Barzilay(MIT,EECS Departm ...

  3. MIT自然语言处理第二讲:单词计数(第一、二部分)

    MIT自然语言处理第二讲:单词计数(第一部分) 自然语言处理:单词计数 Natural Language Processing: (Simple) Word Counting 作者:Regina Ba ...

  4. 斯坦福大学深度学习与自然语言处理第一讲:引言

    斯坦福大学在三月份开设了一门"深度学习与自然语言处理"的课程:CS224d: Deep Learning for Natural Language Processing,授课老师是 ...

  5. MIT自然语言处理第二讲:单词计数(第三、四部分)

    MIT自然语言处理第二讲:单词计数(第三部分) 自然语言处理:单词计数 Natural Language Processing: (Simple) Word Counting 作者:Regina Ba ...

  6. 斯坦福大学深度学习与自然语言处理第一讲引言

    http://www.52nlp.cn/%E6%96%AF%E5%9D%A6%E7%A6%8F%E5%A4%A7%E5%AD%A6%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A ...

  7. DICOM标准及应用——第一讲 DICOM标准概述

    一 什么是DICOM? DICOM是Digital Imaging and COmmunication of Medicine的缩写,是美国放射学会(American College of Radio ...

  8. Python基础学习——面向对象编程(第一讲:面向对象概述、面向对象三个基本特征(封装性、继承性、多态性)、类和对象(定义类、创建和使用对象、实例变量、类变量、构造方法、实例方法、类方法、静态方法))

    面向对象是Python最重要的特性,在Python中一切数据类型都是面向对象的. 1.面向对象概述 面向对象的编程思想是,按照真实世界客观事物的自然规律进行分析,客观世界中存在什么样的实体,构建软件系 ...

  9. 网络安全第一讲 计算机网络安全概述

    一 网络安全基本概念 1.网络安全定义 安全在字典中的定义是为了防范间谍活动或蓄意破坏.犯罪.攻击而采取的措施. 网络安全就是为了防范计算机网络硬件.软件.数据被偶然或蓄意破坏.篡改.窃听.假冒.泄露 ...

最新文章

  1. Silverlight:SSL教程
  2. linux系统之编译安装mysql
  3. 科研人的暑假:学长下地中暑,博士小姐姐留校养鱼......
  4. C#中WebBrowser控件的使用
  5. linux 安装 wkhtmltox
  6. Facebook再遭黑客攻击 部分账户密码被盗
  7. 克里斯坦森:管理水平高的公司往往离崩塌不远
  8. 提高网页效率的14条准则
  9. 三角形状的点阵模糊效果iOS源码
  10. 2012年度IT博客大赛50强报道:张开涛
  11. SpringBoot整合银联无跳转支付附源码
  12. Linux内核4.14版本——GPIO子系统(2)——gpio control driver分析
  13. 图扑软件数字孪生民航飞联网,构建智慧民航新业态
  14. python宏定义_宏定义(无参宏定义和带参宏定义),C语言宏定义详解
  15. AOP之基于AspectJ注解总结与案例
  16. ImportError: No module named PyQt4.
  17. 关于使用vue-quill-editor出现p标签的解决方案
  18. python中字典的循环遍历的方式
  19. 使用NanoHttpd在Android上实现HttpServer
  20. 【笔试or面试】3G门户校园招聘

热门文章

  1. nginx 部署静态网页
  2. 谢百三:房价上涨的九大原因
  3. 大象转身,地表最强投行高盛开启转型之路
  4. 计算机视觉工具包Luminoth
  5. 谷歌I/O走进TensorFlow开源模型世界:从图像识别到语义理解
  6. 美国科技三巨头的财报为何集体爆表?原因在这里
  7. 互联网思维与非摩擦经济
  8. Android5.0新特性-Material Design
  9. SpringBoot配置嵌入式Servlet容器
  10. Go语言线程与协程之间的关系之GMP模型