什么是自然语言处理?

自然语言处理(NLP)是指机器理解并解释人类写作、说话方式的能力。

NLP的目标是让计算机/机器在理解语言上像人类一样智能。最终目标是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。

自然语言处理

下面是三个不同等级的语言学分析:

句法学:给定文本的哪部分是语法正确的。

语义学:给定文本的含义是什么?

语用学:文本的目的是什么?

NLP处理语言的不同方面,例如:

音韵学:指代语言中发音的系统化组织。

词态学:研究单词构成以及相互之间的关系。

NLP中理解语义分析的方法:

分布式:它利用机器学习和深度学习的大规模统计策略。

框架式:句法不同,但语义相同的句子在数据结构(帧)中被表示为程式化情景。

理论式:这种方法基于的思路是,句子指代的真正的词结合句子的部分内容可表达全部含义。

交互式(学习):它涉及到语用方法,在交互式学习环境中用户教计算机一步一步学习语言。

我们为什么需要NLP

有了NLP,有可能完成自动语音、自动文本编写这样的任务。

由于大型数据(文本)的存在,我们为什么不使用计算机的能力,不知疲倦地运行算法来完成这样的任务,花费的时间也更少。

这些任务包括NLP的其他应用,比如自动摘要(生成给定文本的总结)和机器翻译。

NLP流程

如果要用语音产生文本,需要完成文本转语音任务

NLP的机制涉及两个流程:

自然语言理解

自然语言生成

自然语言理解(NLU)

NLU是要理解给定文本的含义。文本内每个单词的特性与结构需要被理解。在理解结构上,NLU要理解自然语言中的以下几个歧义性:

词法歧义性:单词有多重含义

句法歧义性:语句有多重解析树

语义歧义性:句子有多重含义

回指歧义性(AnaphoricAmbiguity):之前提到的短语或单词在后面句子中有不同的含义。

接下来,通过使用词汇和语法规则,理解每个单词的含义。

然而,有些词有类似的含义(同义词),有些词有多重含义(多义词)。

自然语言生成(NLG)

NLG是从结构化数据中以可读地方式自动生成文本的过程。自然语言生成的问题是难以处理。

自然语言生成可被分为三个阶段:

1、文本规划:完成结构化数据中基础内容的规划。

2、语句规划:从结构化数据中组合语句,来表达信息流。

3、实现:产生语法通顺的语句来表达文本。

NLP与文本挖掘(或文本分析)之间的不同

自然语言处理是理解给定文本的含义与结构的流程。

文本挖掘或文本分析是通过模式识别提起文本数据中隐藏的信息的流程。

自然语言处理被用来理解给定文本数据的含义(语义),而文本挖掘被用来理解给定文本数据的结构(句法)。

自然语言处理

例如,在“I found my wallet near the bank”一句中,NLP的任务是理解句尾“bank”一词指代的是银行还是河边。

大数据中的NLP

如今所有数据中的80%都可被用到,大数据来自于大公司、企业所存储的信息。例如,职员信息、公司采购、销售记录、经济业务以及公司、社交媒体的历史记录等。

尽管人类使用的语言对计算机而言是模糊的、非结构化的,但有了NLP的帮助,我们可以解析这些大型的非结构化数据中的模式,从而更好地理解里面包含的信息。

NLP可使用大数据解决商业中的难题,比如零售、医疗、金融领域中的业务。

如何快速入门NLP自然语言处理概述
人工智能与自然语言处理概述:AI三大阶段、NLP关键应用领域
NLP自然语言处理技术,在人工智能法官中的应用是什么?
多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站

自然语言处理是什么,我们为什么需要处理自然语言?相关推荐

  1. 自然语言理解属于计算机应用的那个范畴,基于自然语言理解的3D场景构造研究-计算机应用技术专业论文.docx...

    汕头大学硕士学位论文基于 汕头大学硕士学位论文 基于自然语言理解的 3D 场景构造 I I 摘要 自然语言自动生成三维场景可以减少手工构建所耗费的人力物力,为了减少这些消 耗,国内外的很多学者对这方面 ...

  2. 自然语言处理「迷惑行为大赏」,自然语言处理太难难难了!

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 强烈建议本文在NLP相关人士陪同下观看 01 机器翻译:是在下输了... 02 &qu ...

  3. python自然语言处理答案_《用Python进行自然语言处理》 第一章练习题答案

    尝试使用Python解释器作为一个计算器,输入表达式,如12/(4+1). >>> 12 / (4 + 1) 2.4 26 个字母可以组成 26 的 10 次方或者 26**10个 ...

  4. 利用计算机将一种自然语言,()是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。...

    _ 签发商业汇票以支付采购材料的价税款应使用"银行存款"科目进行核算.() 患者,男性,35岁,参加宴会后感上腹部疼痛伴呕吐3次,病后6小时来院就诊:查体:腹稍隆,全腹压痛,反 请 ...

  5. 浅谈自然语言处理技术在自动化的应用

    自然语言处理与技术其在自动化的应用 引言 作为人工智能领域的一个重要分支,自然语言处理在目前的学术界领域非常的有市场.无论从哪个方面来看,自然语言处理技术,非常的具有前瞻性.目前,自然语言处理技术应以 ...

  6. 语言模型自然语言处理[置顶] 哥伦比亚大学 自然语言处理 公开课 授课讲稿 翻译(四)...

    每日一贴,今天的内容关键字为语言模型自然语言处理 媒介:灵机一动看了一个自然语言处理公开课,大牛柯林斯讲解的.认为很好,就自己动手把它的讲稿翻译成中文.一方面,希望通过这个翻译过程,让自己更加理解大牛 ...

  7. 【转载】自然语言推理介绍

    原文链接 自然语言推理介绍 自然语言推理作为自然语言理解的一个重要组成部分,在整个自然语言理解中扮演着重要的角色,接下里我将对自然语言推理的现状做一简单总结,以下内容是我的小组分享的记录版. 自然语言 ...

  8. 活动要点回顾 | 智源论坛:自然语言处理报告会

    2019年11月7日,北京智源人工智能研究院在清华大学FIT楼举办了"智源论坛(第八期):自然语言处理报告会".四位智源学者--北京大学教授穗志方.清华大学长聘教授李涓子.北京大学 ...

  9. 2019年深度学习自然语言处理最新十大发展趋势(附下载报告)

    来源:专知 本文约5100字,建议阅读10分钟. 本文介绍了近日FloydHub 博客上Cathal Horan中自然语言处理的10大发展趋势. [ 导读 ]自然语言处理在深度学习浪潮下取得了巨大的发 ...

  10. 一起走进自然语言处理的世界

    自然语言处理简介 方向简介 自然语言处理主要技术 资料推荐--开始旅程! 总结及未来方向 自然语言处理简介 自然语言处理(Natural Language Processing,简称NLP)就是用计算 ...

最新文章

  1. keras和tensorflow 报错解决:UserWarning: Method on_batch_end() is slow compared to the batch update Check
  2. oracle新建用户名和密码,Oracle安装后忘记用户名或密码+创建新登陆用户
  3. 转化率极高的十个网站 怎样来提高转化率
  4. 超图js版本加载点图层和点要素
  5. TF之VGG系列:利用预先编制好的脚本data_convert .py文件将图片格式转换为tfrecord 格式
  6. 1-36随机生成6个不重复的数
  7. Visual C++——定时刷新重绘窗口[WM_PAINT消息]解决方案
  8. 解决Win10 Virtualbox5.2.18桥接不能联网小记
  9. vue1升级到vue2的问题
  10. 错误:Mixed Content: The page at ‘https://XXX’ was loaded over HTTPS, but requested an in...
  11. 6月第4周全球域名注册商(国际域名)新增注册量TOP22
  12. (How to)Windows Live Writer插入Latex公式(补充)
  13. Memcache 查看列出所有key的方法
  14. 网页中打开msn窗口方法
  15. 讲讲那些 H-桥电路 的基本道理
  16. 简易交通灯控制器Verilog
  17. 探索性数据分析(四)——特征工程(对数转换、标准化/归一化、离散化、标签编码、独热编码、Dummy变量)
  18. Python iter()函数
  19. JAVA个版本新特性
  20. daimayuan每日一题#810 最短路计数

热门文章

  1. PySpark RDD 之collect、 take、top、first取值操作
  2. 中国剩余定理与韩信点兵问题原理
  3. 2017前端开发手册三-前端职位描述
  4. 红米手机开发者选项usb调试如何开启
  5. 《30天自制操作系统》学习笔记--第11天
  6. mysql启动报错之[ERROR] Found option without preceding group in config file /etc/my.cnf at line
  7. VS Visual Studio 2022调试控制台 输出不全 不完整 缺内容 少了很多代码 有屋设计拆单管理一体化软件 全屋定制拆单 橱柜衣柜整装 木门归方程序
  8. 服务器未能识别网络,服务器无法识别url中特殊字符的处理方式
  9. 英国议会上院AI报告AI in the UK-ready, willing and able附原文183页(赞赏后下载ZIP包)
  10. python如何调整word表格宽度_python-docx编辑word表格