https://www.toutiao.com/a6709740042509615619/

随着人工智能的进步和技术变得越来越复杂,我们希望现有的概念能够接受这种变化或者改变自己。同样,在自然语言的计算机辅助处理领域,自然语言处理的概念是否会让位于自然语言理解?或者这两个概念之间的关系是否比仅仅技术的线性进展更微妙和复杂?

在这篇文章中,我们将仔细研究NLP和NLU的概念以及它们在AI相关技术中的优势。

重要的是,虽然有时可以互换使用,但它们是两个有一些重叠的不同概念。首先,他们都处理自然语言和人工智能之间的关系。他们都试图理解非结构化数据,如语言,而不是像统计、行动等结构化数据。但是,NLP和NLU是许多其他数据挖掘技术的对立面。

自然语言处理

NLP是一个已经建立的,已有数十年历史的领域,在计算机科学、人工智能以及越来越多的数据挖掘领域开展业务。 NLP的最终目的是通过机器读取、解读、理解人类语言,将某些任务从人类身上移除并允许机器来处理它们。此类任务的常见实际示例是在线聊天机器人、文本摘要生成器,自动生成的关键字选项卡,以及分析给定文本情绪的工具。

NLP的作用

从广义上讲,NLP可以指代广泛的工具,例如语音识别、自然语言识别和自然语言生成。然而,NLP最常见的任务是历史性的:

  • 符号化
  • 解析
  • 信息提取
  • 相似
  • 语音识别

自然语言和语言世代以及许多其他语言。

在现实生活中,NLP用于文本摘要、情感分析、主题提取、命名实体识别、词性标注、关系提取、词干提取、文本挖掘、机器翻译和自动问答,本体填充、语言建模和我们可以想到的所有与语言相关的任务。

NLP技术NLP的两个支柱是句法分析和语义分析。

总之:NLP依靠机器学习通过分析文本语义和语法从人类语言中获得意义。

自然语言理解

虽然NLP可以追溯到20世纪50年代,当计算机程序员开始尝试简单的语言输入时,NLU在20世纪60年代开始开发,希望让计算机能够理解更复杂的语言输入。它被认为是NLP的一个子主题,自然语言的目的较窄,主要侧重于机器阅读理解:让计算机理解文本的真正含义。

NLU实际上做了什么

与NLP类似,NLU使用算法将人类语音降低为结构化本体。然后AI算法检测意图、时间、位置和情绪等事物。但是,当我们查看NLU任务时,我们会惊讶地发现这个概念建立了多少NLP:

NLU任务

自然语言理解是许多过程的第一步,例如分类文本、收集新闻、归档单个文本以及更大规模地分析内容。 NLU的现实世界范例包括小任务,例如基于理解文本发布短命令到一定程度,例如基于基本语法将电子邮件重新路由到合适的人和一个体面大小的词典。更为复杂的努力可能是完全理解新闻文章或诗歌或小说中的含义。

总而言之:最好将NLU视为实现NLP的第一步:在机器处理语言之前,必须首先理解它。

NLP和NLU如何相关联的

从其任务可以看出,NLU是自然语言处理的一个组成部分,它是负责人类理解某个文本所呈现的含义的部分。与NLP最大的区别之一是NLU不仅仅是理解单词,它还试图解释人为常见的错误,如错误发音或字母或单词的位移。

推动NLP的假设是Noam Chomsky在1957年的“句法结构”中所设定的假设:“语言L的语言分析的基本目标是将L的句子的语法序列与不符合语法的序列分开。不是L的句子,而是研究语法序列的结构。“

句法分析确实用于多种任务中,通过将语法规则应用于一组单词,并通过多种技术从中获得意义,从而评估语言如何与愈发规则保持一致:

  • 词形还原:将单词的变形形式简化为单一形式,以便于分析。
  • 词干提取:将变形的词语切割成词根形式。
  • 语素切分:将单词划分为语素。
  • 分词:将连续文本分成不同的单元。
  • 解析:句子的语法分析。
  • 词性标注:为每个单词识别词性。
  • 断句:在连续的文本上设置句子边界。

句法分析技术

但是,语法正确性或不正确性并不总是与短语的有效性相关。想想一个无意义的语法句子的经典例子“无色的绿色思想疯狂地睡觉。”更重要的是,在现实生活中,有意义的句子通常包含小错误,可以归类为不合语法。人工交互允许产生的文本和语音中的错误通过优秀的模式识别和从上下文中获取附加信息来补偿它们。这显示了以语法为中心的分析的不平衡性以及需要更加关注多级语义。

语义分析是NLU的核心,涉及应用计算机算法来理解单词的含义和解释,但尚未完全解决。

以下是语义分析中的一些技巧,仅举几例:

  • 命名实体识别(NER):确定可以识别并分类为预设组的文本部分。
  • 词义消歧:根据语境赋予词语意义。
  • 自然语言生成:使用数据库导出语义意图并将其转换为人类语言。

然而,为了完全理解自然语言,机器不仅需要考虑语义提供的字面意义,还需要考虑预期的信息,或理解文本试图实现的内容。这个级别称为语用分析,它刚刚开始引入NLU / NLP技术。目前,我们可以在一定程度上看到情绪分析:评估文本中包含的消极/积极/中立感受。

NLP的未来

为了实现创建一个能够以人类方式与人类互动的聊天机器人的目标,最后,通过图灵测试,企业和学术界正在投入更多的NLP和NLU技术。他们想到的产品旨在轻松,无人监督,并能够以适当和成功的方式直接与人们互动。

为实现这一目标,该研究分三个层次进行:

  • 语法 - 理解文本的语法。
  • 语义 - 理解文本的字面意义。
  • 语用学 - 理解文本的意图

不幸的是,理解和处理自然语言并不像提供足够大的词汇量和训练机器那么简单。要取得成功,NLP必须融合来自各个领域的技术:语言、语言学、认知科学、数据科学、计算机科学等。只有结合所有可能的观点,我们才能揭开人类语言的神秘面纱。

揭开人类语言的神秘面纱:从理解到处理自然语言相关推荐

  1. android mimi 病毒如何,迷你脑将揭开人类朊病毒的神秘面纱

    原标题:迷你脑将揭开人类朊病毒的神秘面纱 朊病毒病是一种可传染的致命性神经退行性疾病,会感染人类和动物.该疾病可自发发生,也可遗传或由于暴露于受污染的物质而获得.朊病毒病的进展会导致尿蛋白酶抵抗性朊蛋 ...

  2. 逍遥自在学C语言 | 揭开while循环的神秘面纱

    前言 循环是一种重要的控制结构,可以使程序重复执行一段代码,直到满足特定条件为止. 在C语言中,while和do-while是两种常用的循环结构,本文将详细介绍这两种循环的用法. 一.人物简介 第一位 ...

  3. 揭开均线系统的神秘面纱_揭开依赖注入的神秘面纱,并通过此快速介绍了解它的实际应用...

    揭开均线系统的神秘面纱 by Sankalp Bhatia 通过Sankalp Bhatia 揭开依赖注入的神秘面纱,并通过此快速介绍了解它的实际应用 (Demystify Dependency In ...

  4. 揭开webRTC媒体服务器的神秘面纱——WebRTC媒体服务器开源项目介绍

    揭开webRTC媒体服务器的神秘面纱--WebRTC媒体服务器&开源项目介绍 WebRTC生态系统是非常庞大的.当我第一次尝试理解WebRTC时,网络资源之多让人难以置信.本文针对webRTC ...

  5. 揭开Java 泛型类型擦除神秘面纱

    转载自   揭开Java 泛型类型擦除神秘面纱 泛型,一个孤独的守门者. 大家可能会有疑问,我为什么叫做泛型是一个守门者.这其实是我个人的看法而已,我的意思是说泛型没有其看起来那么深不可测,它并不神秘 ...

  6. .net单点登录demo_图文并茂,为你揭开“单点登录“的神秘面纱

    本文首发于政采云前端团队博客:图文并茂,为你揭开"单点登录"的神秘面纱 https://www.zoo.team/article/sso 概念 单点登录( Single Sign ...

  7. 揭开均线系统的神秘面纱_在应用程式审查API中揭开新玩法的神秘面纱

    揭开均线系统的神秘面纱 During the #11WeeksOfAndroid the new Play In-App Review API was announced. This was a lo ...

  8. html5实现单点登录,图文并茂,为你揭开“单点登录“的神秘面纱

    概念 单点登录( Single Sign On ,简称 SSO),是目前比较流行的企业业务整合的解决方案之一,用于多个应用系统间,用户只需要登录一次就可以访问所有相互信任的应用系统. 前置介绍 同源策 ...

  9. 揭开 Growth Hacking 的神秘面纱(番外篇)+ 大结局

    揭开 Growth Hacking 的神秘面纱(番外篇)+ 大结局 覃超帝国兴亡史  12月11日 11:45 FACEBOOK  互联网  分类 :互联网 阅读:1527 抢沙发 Growth Ha ...

最新文章

  1. 自编码clone图解
  2. java序列化和反序列化工具_Java 序列化和反序列化工具类并解决StreamCorruptedException问题 | 学步园...
  3. 【巧妙算法系列】【Uva 11464】 - Even Parity 偶数矩阵
  4. Python删除文件及进行文件夹压缩
  5. WPF 3D和光照学习1
  6. Pandas to_json() 中文乱码,转化为json数组
  7. c++ ea 代码 生成_看EA如何生成代码框架
  8. Android处理键盘事件的小例子
  9. python编程快速上手第四章_《Python编程快速上手——让繁琐的工作自动化》读书笔记 第四章 列表...
  10. excel数据透视表应用大全_从Excel进阶到Python:更强大的数据透视表
  11. 全志平台camera驱动开发(3)MIPI接口camera驱动开发
  12. 简谈几种常用的库函数
  13. mysql 预处理stmt操作(写入数据库和从数据库中取出)
  14. KMS和MAK的区别
  15. 带有Arduino的WS2812B可寻址RGB LED灯条指南
  16. 债券基础知识和可转债剖析
  17. Echarts实战案例代码(9):图表纹理填充的解决方案(柱图为例)
  18. 解决:linux启动Redis报Failed to search for file:Cannot prepare internal mirrorlist: No URLs in mirrorlist
  19. 苹果打字怎么换行_iPhone实用小技巧,安卓转苹果的同学看完收获尤其大
  20. 清华北大2018届毕业生去向统计

热门文章

  1. python字符串符号替换punctuation
  2. 如何提高强化学习效果?内在奖励和辅助任务
  3. 常年霸榜 Amazon 数据结构与算法领域 TOP3
  4. AD-NeRF:用于说话人头部合成的音频驱动神经辐射场
  5. 论如何骗过计算机视觉AI网络,UCLA专家为你支几招
  6. TensorFLow能够识别的图像文件,可以通过numpy
  7. 使用GitLab或者Github简单实用地将数据导入Colab的方法
  8. 时间序列数据的预处理
  9. 无副作用、效果超越吗啡!用微电极精准管理大脑“疼痛中心”,科学家探索止痛新方法...
  10. 报道 | 1899篇论文、1329个机构、6012位作者,NeurIPS 2020谁在独领风骚?