自然语言处理是一门融语言学、计算机科学、数学于一体的科学。自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等方面。

本教程操作环境:windows7系统、Dell G3电脑。

自然语言处理( Natural Language Processing, NLP)是一门融语言学、计算机科学、数学于一体的科学。

自然语言处理是指利用人类交流所使用的自然语言与机器进行交互通讯的技术。通过人为的对自然语言的处理,使得计算机对其能够可读并理解。自然语言处理的相关研究始于人类对机器翻译的探索。虽然自然语言处理涉及语音、语法、语义、语用等多维度的操作,但简单而言,自然语言处理的基本任务是基于本体词典、词频统计、上下文语义分析等方式对待处理语料进行分词,形成以最小词性为单位,且富含语义的词项单元。

自然语言处理以语言为对象,利用计算机技术来分析、理解和处理自然语言的一门学科,即把计算机作为语言研究的强大工具,在计算机的支持下对语言信息进行定量化的研究,并提供可供人与计算机之间能共同使用的语言描写。包括自然语言理解( NaturalLanguage Understanding, NLU)和自然语言生成( Natural LanguageGeneration, NLG)两部分。它是典型边缘交叉学科,涉及到语言科学、计算机科学、数学、认知学、逻辑学等,关注计算机和人类(自然)语言之间的相互作用的领域。人们把用计算机处理自然语言的过程在不同时期或侧重点不同时又称为自然语言理解( Natural Language Understanding, NLU)、人类语言技术( Human Language Technology, HLT)、计算语言学Hl(Computational Linguistics)、计量语言学( QuantitativeLinguistics)、数理语言学( Mathematical Linguistics)。

实现人机间自然语言通信意味着要使计算机既能理解自然语言文本的意义,也能以自然语言文本来表达给定的意图、思想等。前者称为自然语言理解,后者称为自然语言生成。因此,自然语言处理大体包括了自然语言理解和自然语言生成两个部分。历史上对自然语言理解研究得较多,而对自然语言生成研究得较少。但这种状况已有所改变。

相关推荐:《编程学习》

无论实现自然语言理解,还是自然语言生成,都远不如人们原来想象的那么简单,而是十分困难的。从现有的理论和技术现状看,通用的、高质量的自然语言处理系统,仍然是较长期的努力目标,但是针对一定应用,具有相当自然语言处理能力的实用系统已经出现,有些已商品化,甚至开始产业化。典型的例子有:多语种数据库和专家系统的自然语言接口、各种机器翻译系统、全文信息检索系统、自动文摘系统等。

自然语言处理,即实现人机间自然语言通信,或实现自然语言理解和自然语言生成是十分困难的。造成困难的根本原因是自然语言文本和对话的各个层次上广泛存在的各种各样的歧义性或多义性(ambiguity)。

自然语言的形式(字符串)与其意义之间是一种多对多的关系。其实这也正是自然语言的魅力所在。但从计算机处理的角度看,我们必须消除歧义,而且有人认为它正是自然语言理解中的中心问题,即要把带有潜在歧义的自然语言输入转换成某种无歧义的计算机内部表示。

歧义现象的广泛存在使得消除它们需要大量的知识和推理,这就给基于语言学的方法、基于知识的方法带来了巨大的困难,因而以这些方法为主流的自然语言处理研究几十年来一方面在理论和方法方面取得了很多成就,但在能处理大规模真实文本的系统研制方面,成绩并不显著。研制的一些系统大多数是小规模的、研究性的演示系统。

目前存在的问题有两个方面:一方面,迄今为止的语法都限于分析一个孤立的句子,上下文关系和谈话环境对本句的约束和影响还缺乏系统的研究,因此分析歧义、词语省略、代词所指、同一句话在不同场合或由不同的人说出来所具有的不同含义等问题,尚无明确规律可循,需要加强语用学的研究才能逐步解决。另一方面,人理解一个句子不是单凭语法,还运用了大量的有关知识,包括生活知识和专门知识,这些知识无法全部贮存在计算机里。因此一个书面理解系统只能建立在有限的词汇、句型和特定的主题范围内;计算机的贮存量和运转速度大大提高之后,才有可能适当扩大范围.

以上存在的问题成为自然语言理解在机器翻译应用中的主要难题,这也就是当今机器翻译系统的译文质量离理想目标仍相差甚远的原因之一;而译文质量是机译系统成败的关键。中国数学家、语言学家周海中教授曾在经典论文《机器翻译五十年》中指出:要提高机译的质量,首先要解决的是语言本身问题而不是程序设计问题;单靠若干程序来做机译系统,肯定是无法提高机译质量的;另外在人类尚未明了大脑是如何进行语言的模糊识别和逻辑判断的情况下,机译要想达到“信、达、雅”的程度是不可能的。

想要查阅更多相关文章,请访问PHP中文网!!

自然语言处理不属于计算机科学,自然语言处理是一门融语言学、计算机科学和什么于一体的科学...相关推荐

  1. MySQL与自然语言处理_zt 计算语言学 与 自然语言处理

    计算语言学和自然语言处理简介 一.从一个例子开始 2001年美国电影<太空奥德赛>中的一段对话: (Screenplay 0f 2001: A Space Odyssey,Stanley ...

  2. r语言进行自然语言处理_开始进行自然语言处理

    r语言进行自然语言处理 当今,大多数应用程序仍在处理来自结构化和半结构化源的数据的世界中工作. 它们连接到SQL数据库以查询信息或显示来自JSON或XML数据源的信息. 许多应用程序仍避免从非结构化源 ...

  3. 计算机科学与导论期末论文题目,★计算机科学与技术导论论文题目计算机科学与技术导论毕业论文题目大全计算机科学与技术导论论文选题参考(3页)-原创力文档...

    ★计算机科学与技术导论论文题目计算机科学与技术导论毕业论文题目大全计算机科学与技术导论论文选题参考 1.计算机科学与技术专业导论课程相关问题探讨 2.高等学校教材·计算机科学与技术:计算机导论(第2版 ...

  4. AP计算机科学有几门,2017新增AP计算机科学考试科目

    国际教育网讯:早在2016年年底的时候,我们总结过AP在2017将发生的政策变化,其中一个是新增一个科目,AP计算机科学考试,下面就分享AP计算机科学部分的考试大纲,今年打算参加考试的同学赶快收藏好. ...

  5. 计算机科学与技术的知识要求,0812计算机科学与技术基本要求.doc

    0812 计算机科学与技术 博士.硕士学位基本要求 第一部分 学科概况和发展趋势 计算机科学与技术是 20 世纪 40 年代创建并迅速发展的 科学技术领域,主要围绕计算机的设计与制造,以及信息获 取. ...

  6. b-2014四川电子机械职业技术学院计算机科学与技术毕业设计选题,2014届计算机科学与技术专业本科毕业设计(论文)选题指南...

    宁夏师范学院数学与计算机科学学院 2014届计算机科学与技术专业毕业设计(论文)选题指南 一.计算机科学与技术专业的学科领域 计算机科学与技术专业(080605)属于电气信息类专业,电气信息类专业还包 ...

  7. 重庆邮电大学计算机科学与技术培养方案,重庆邮电大学计算机科学与技术学院.doc...

    重庆邮电大学计算机科学与技术学院.doc 重庆邮电大学计算机科学与技术学院 2005--2006学年第二学期中期教学检查汇报材料 2006年是我校发展史上具有里程碑意义的一年,学校正式更名为重庆邮电大 ...

  8. 计算机科学与技术的专业论述,关于计算机科学专业的论文题目 计算机科学专业论文题目怎样定...

    [100道]关于关于计算机科学专业的论文题目汇总,作为大学生的毕业生应该明白了计算机科学专业论文题目怎样定,选一个好的题目后续的计算机科学专业论文写作起来会更轻松! 一.比较好写的计算机科学专业论文题 ...

  9. 未来是计算机科学的天下,美国留学信息与计算机科学发展方向

    美国留学信息与计算机科学发展方向 我们知道美国的信息与计算机科学非常的发达,尤其是以美国硅谷为代表的地区,简直就是世界计算机科学的摇篮,未来的生活已经不能离开信息与计算机科学,那么他的未来发展方向又在 ...

最新文章

  1. LeetCode LFU Cache
  2. python类方法是什么_python类方法和普通方法区别是什么
  3. 加载tensorflow模型后只运行变量名实现预测(sess.run)
  4. spring boot整合mybatis+通用mapper+pagehelper分页插件
  5. React ref的转发
  6. 谷粒商城三阶段课件_苏科版初中物理九年级上册二、变阻器公开课优质课课件教案视频...
  7. Cycle-1(循环)
  8. 从单机到2000万QPS: 知乎Redis平台发展与演进之路
  9. 如何在SqlServer中获取前端连接的IP地址,计算机名等信息
  10. Linux下搭建FastDFS文件服务器(亲测成功)
  11. 开发宝典:数据库设计技巧,你知道几个?
  12. 软件测试系列——冒烟测试
  13. uniApp APP端调起微信支付失败errCode:-100的踩坑
  14. KMP的个人向总结(next数组 || DFA实现--JAVAC++魔改版)--by wxj
  15. 【原创】关于Golang和Rust对比及语言的选择思考
  16. 为什么要进行实名认证?如何实名认证?
  17. python实现简陋的贪吃蛇小游戏
  18. 了解 Gradle 和 buildType Task
  19. dedecms顶级栏目列表、子栏目列表调用DEDECMS调用父栏目名称
  20. NUS CS5477 assignment1

热门文章

  1. Storm DRPC 使用及访问C++ Bolt问题的解决方法
  2. java -- 函数/方法
  3. BLE协议栈 – SM
  4. 大型客服外包公司和小型客服外包公司的不同
  5. Windows版GIT的用法
  6. python中常见的三种选择结构_在Python中,实现多分支选择结构的最佳方法是
  7. 物联网APP开发的好处有哪些
  8. UNP卷一chapter17 ioctl操作
  9. Apollo学习(一)Apollo初学入门
  10. appollo-二次规划ST速度优化