自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。

自然语言处理技术是所有与自然语言的计算机处理有关的技术的统称,其目的是使计算机理解和接受人类用自然语言输入的指令,完成从一种语言到另一种语言的翻译功能,自然语言处理技术的研究,可以丰富计算机知识处理的研究内容,推动人工智能技术的发展。

大快NLP模块是大快大数据一体化平台的一个组件,用户引用该组件可以有效进行自然语言的处理工作,如进行文章摘要,语义判别以及提高内容检索的精确度和有效性。

自然语言处理如今不仅作为人工智能核心课题来研究,而且也作为新一代计算机的核心课题来研究。从知识产业角度看,专家系统,数据库,知识库,计算机辅助设计系统(CAD)、计算机辅助教学系统(CAI)、计算机辅助决策系统,办公室自动化管理系统,智能机器人等,都需要用自然语言处理,具有篇章理解能力的自然语言理解系统可用于机器自动翻译、情报检索、自动标引、自动文摘、自动写故事小说等领域,都可以用我们的工具类DKNLPBase来处理。

标准分词

方法签名:List<Term> StandardTokenizer.segment(String txt);

返回:分词列表。

签名参数说明:txt:要分词的语句。

范例:下例验证一段话第5个分词是阿法狗。

public void testSegment() throws Exception

{

String text = "商品和服务";

List<Term> termList = DKNLPBase.segment(text);

assertEquals("商品", termList.get(0).word);

assertEquals("和", termList.get(1).word);

assertEquals("服务", termList.get(2).word);

text = "柯杰解说“李世石VS阿法狗第二局” 结局竟是这样";

termList = DKNLPBase.segment(text);

assertEquals("阿法狗", termList.get(5).word);  // 能够识别"阿法狗"

}

关键词提取

方法签名:List<String>  extractKeyword(String txt,int keySum);

返回:关键词列表.

签名参数说明:txt:要提取关键词的语句,keySum要提取关键词的数量

范例:给出一段话提取一个关键词是“程序员”。

public void testExtractKeyword() throws Exception

{

String content = "程序员(英文Programmer)是从事程序开发、维护的专业人员。" +

"一般将程序员分为程序设计人员和程序编码人员," +

"但两者的界限并不非常清楚,特别是在中国。" +

"软件从业人员分为初级程序员、高级程序员、系统" +

"分析员和项目经理四大类。";

List<String> keyword = DKNLPBase.extractKeyword(content, 1);

assertEquals(1, keyword.size());

assertEquals("程序员", keyword.get(0));

}

短语提取

方法签名:List<String> extractPhrase(String txt, int phSum);

返回:短语

签名参数说明:txt:要提取短语的语句,phSum短语数量

范例:给出一段文字,能代表文章的五个短语,第一个短语是算法工程师。

迈进二十一世纪,我们已经进入了以互联网为主要标志的海量信息时代,这些海量信息大部分是以自然语言表示的。一方面,海量信息也为计算机学习人类语言提供了更多的“素材”,另一方面,这也为自然语言处理提供了更加宽广的应用舞台。例如,作为自然语言处理的重要应用,搜索引擎逐渐成为人们获取信息的重要工具,涌现出以百度、谷歌等为代表的搜索引擎巨头;机器翻译也从实验室走入寻常百姓家,谷歌、百度等公司都提供了基于海量网络数据的机器翻译和辅助翻译工具;基于自然语言处理的中文(输入法如搜狗、微软、谷歌等输入法)成为计算机用户的必备工具;带有语音识别的计算机和手机也正大行其道,协助用户更有效地工作学习。总之,随着互联网的普及和海量信息的涌现,自然语言处理正在人们的日常生活中扮演着越来越重要的作用。

然而,我们同时面临着一个严峻事实,那就是如何有效利用海量信息已成为制约信息技术发展的一个全局性瓶颈问题。自然语言处理无可避免地成为信息科学技术中长期发展的一个新的战略制高点。同时,人们逐渐意识到,单纯依靠统计方法已经无法快速有效地从海量数据中学习语言知识,只有同时充分发挥基于规则的理性主义方法和基于统计的经验主义方法的各自优势,两者互相补充,才能够更好、更快地进行自然语言处理。

自然语言处理作为一个年龄尚不足一个世纪的新兴学科,正在进行着突飞猛进的发展。回顾自然语言处理的发展历程,并不是一帆风顺,有过低谷,也有过高潮。而现在我们正面临着新的挑战和机遇。例如,目前网络搜索引擎基本上还停留在关键词匹配,缺乏深层次的自然语言处理和理解。语音识别、文字识别、问答系统、机器翻译等目前也只能达到很基本的水平。路漫漫其修远兮,自然语言处理作为一个高度交叉的新兴学科,不论是探究自然本质还是付诸实际应用,在将来必定会有令人期待的惊喜和异常快速的发展。

什么是自然语言处理技术相关推荐

  1. 浅谈自然语言处理技术在自动化的应用

    自然语言处理与技术其在自动化的应用 引言 作为人工智能领域的一个重要分支,自然语言处理在目前的学术界领域非常的有市场.无论从哪个方面来看,自然语言处理技术,非常的具有前瞻性.目前,自然语言处理技术应以 ...

  2. 新闻行业中,自然语言理解技术该如何应用?

    在信息爆炸时代下,要想快速获取有价值的内容非常困难,这一点在新闻行业中尤为明显,而本文提到的自然语言理解技术将会是一个不错的解决建议. 自然语言理解技术在新闻行业中的应用 现如今,人类生活在一个信息大 ...

  3. Keras蚂蚁金服大赛实战——自然语言处理技术

    之前在自然语言处理技术系列的第一篇NER实战的结语中介绍过:序列标注(分词,NER),文本分类(情感分析),句子关系判断(语意相似判断),句子生成(机器翻译)是NLP领域的四大任务,之后我又陆续简单介 ...

  4. 自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作。多年来主要从事推荐系统以及机

    自然语言处理技术(NLP)在推荐系统中的应用 原2017.06.29人工智能头条 作者: 张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索.推荐以及算法相关工作.多年来主要从事推荐系统以及机 ...

  5. NLP:自然语言处理技术近十年发展技术更迭的简介、案例之详细攻略(持续更新)

    NLP:自然语言处理技术近十年发展技术更迭的简介.案例之详细攻略(持续更新) 目录 自然语言处理技术近十年发展技术更迭的简介.案例

  6. AI之NLP:自然语言处理技术简介(是什么/学什么/怎么用)、常用算法、经典案例之详细攻略(建议收藏)

    AI之NLP:自然语言处理技术简介(是什么/学什么/怎么用).常用算法.经典案例之详细攻略(建议收藏) 目录 NLP是什么? 1.NLP前置技术解析 2.python中NLP技术相关库 3.NLP案例 ...

  7. 送书福利 | 大数据智能:数据驱动的自然语言处理技术

    刘知远 崔安颀 等编著 电子工业出版社-博文视点 2020-01 ISBN: 9787121375385 定价: 89.00 元 新书推荐 ????今日福利 |关于本书| 本书前身<大数据智能- ...

  8. 盲人方便的使用计算机输入文字,中文信息学报盲人用计算机软件系统中的语音和自然语言处理技术Ξ.PDF...

    中文信息学报盲人用计算机软件系统中的语音和自然语言处理技术Ξ 中 文 信 息 学 报 第 18 卷 第 4 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vo ...

  9. 自然语言处理技术在推荐系统中的应用和发展(附交流视频和PPT下载链接)

    今天给大家带来山东大学任昭春老师在2020年5月10日举办的"推荐系统前沿进展"系列学术沙龙活动中所做的分享<自然语言处理技术在推荐系统中的应用与发展>,本次分享从自然 ...

  10. 大快HanLP自然语言处理技术介绍

    大快HanLP自然语言处理技术介绍 这段时间一直在接触学习hadoop方面的知识,所以说对自然语言处理技术也是做了一些了解.网络上关于自然语言处理技术的分享文章很多,今天就给大家分享一下HanLP方面 ...

最新文章

  1. 【swjtu】数据结构实验5_基于十字链表的稀疏矩阵转置
  2. PC Lint 初学
  3. 关于JAVA并发编程你需要知道的——硬件篇
  4. mysql 游标总条数_mysql 游标的使用总结
  5. Spring mvc 组件
  6. 青蛙换位置excel_吃青蛙:如何在Excel中创建每日交付的sprint消耗图
  7. arm linux输出到lcd,求助 armlinux中实现lcd显示
  8. python requests下载图片_Python使用urllib库、requests库下载图片的方法比较
  9. nlp基础—10.结巴分词的应用及底层原理剖析
  10. Unix环境高级编程第三版
  11. LINUX下打包jar
  12. wps桌面右键缺少新建文档入口
  13. 计算机软件工程专业研究生大学排名,软件工程研究生院校排名
  14. 基于net-snmp的代理端及管理端开发手册
  15. 同时使用 IE7 和 IE6 的方法
  16. html链接怎么恢复,Word文档中目录的超链接取消后怎么样恢复?
  17. tun驱动之read
  18. 深度学习框架PyTorch入门与实践:第九章 AI诗人:用RNN写诗
  19. Flutter 开关和切换高级指南
  20. 教你挑选适合自己的蜂蜜

热门文章

  1. 机器人仿真软件 V-REP学习记录(序言)
  2. 数字化转型的本质:“研产供销服”各环节的敏捷化
  3. 小白盒子无线打印服务器,玩转无线打印、共享打印机,蒲公英X1盒子和小白学习盒子谁更好...
  4. 什么是DDD开发模式
  5. python群控模拟安卓系统_手机群控脚本通用版安装包下载-手机群控脚本通用版apk(云控平板)v1.0.01真机模拟版_新绿资源网...
  6. 解决华硕笔记本自带触摸板的二指及三指失效的问题
  7. 【C 语言】文件操作 ( fseek 使用注意事项 | fseek 函数返回值分析 )
  8. 基于Spark的GBDT + LR模型实现
  9. IOS AirPrint功能
  10. html css js 注释符号,js 注释怎么写 javascript注释格式|js注释