NLP汉语自然语言处理入门基础知识介绍

自然语言处理定义:

自然语言处理是一门计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部分。这个星球上有许多生物拥有超过人类的视觉系统,但只有人类才拥有这么高级的语言。

自然语言处理的目标是让计算机处理或说“理解”自然语言,以完成有意义的任务,比如订机票购物或QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于实现人工智能。

自然语言处理涉及的几个层次:

作为输入一共有两个来源,语音与文本。所以第一级是语音识别和OCR或分词(事实上,跳过分词虽然理所当然地不能做句法分析,但字符级也可以直接做不少应用)。接下来是形态学,援引《统计自然语言处理》中的定义:形态学(morphology):形态学(又称“词汇形态学”或“词法”)是语言学的一个分支,研究词的内部结构,包括屈折变化和构词法两个部分。由于词具有语音特征、句法特征和语义特征,形态学处于音位学、句法学和语义学的结合部位,所以形态学是每个语言学家都要关注的一门学科。

Hanlp自然语言处理开发包:

从事大数据方面工作的人对自然语言处理必然都是不陌生的,在Github上用户量最多的开源汉语自然语言处理工具是HanLP。HanLP的初始版本是在2014年初开发的,3月份的时候开始在Github上开源。2015年的时候集成在了大快搜索的DKNLP中,目前大快已经把DKNLP技术成果已经开源,并且整体装如HanLP项目,HanLP的版本已经到了V1.50。

Hanlp自然语言处理技术优势:

支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词调、词性标注),命名实体识别(中国人民、音译人民、日本人民,地名,实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析、神经网络依存句法分析)。提供Lucene查件,兼容Solr和ElasticSearch。

Hanlp自然语言处理应用领域:

Hanlp已经被广泛应用于Lucene、Solr、ElasticSearch、hadoop、android、Resin等平台,有大量开源作者开发各种查件与拓展,并且被包装或移植到Python、C#、R、JavaScript等语言上去。

转载于:https://www.cnblogs.com/dashuju2018/p/9835388.html

NLP汉语自然语言处理入门基础知识介绍相关推荐

  1. undo系列学习之undo入门基础知识介绍

    图2: 图3: 图4: 图5: 图6: 图7: 图8: 图9: 图10: 图11: 图12: 图12: 图13: undo的相关统计信息:

  2. Sketch Mac入门基础知识——蒙版(Mask)的详细使用方法介绍

    在上一篇文章,我们认识了Sketch Mac这款软件,在本文中,我们再来看看Sketch Mac入门基础知识--蒙版(Mask)的详细使用方法介绍,让您更多更好的了解Sketch Mac,为以后使用奠 ...

  3. PLC编程入门-01基础知识介绍

    PLC编程入门-01基础知识介绍 PLC的组成结构 PLC编程语言: PLC输入输出的特点 输入 输出 PLC的组成结构 简图 明细图 CPU:控制器和运算器本身就是CPU主要组成部分,和PC的CPU ...

  4. Python培训入门基础知识学什么?

    Python培训基础知识主要是针对一些零基础的同学安排的,虽说Python是相对比较简单的一门编程语言,但是没有基础的同学还是要进行系统的学习,那么Python培训入门基础知识学什么呢?来看看下面小编 ...

  5. ***入门基础知识(超全)

    ***入门基础知识(超全) [sell=2]  DOS 常用命令: dir 列文件名 deltree 删除目录树 cls 清屏 cd 改变当前目录 copy 拷贝文件 diskcopy 复制磁盘 de ...

  6. Python入门基础知识学什么?

    Python基础知识主要是针对一些零基础的同学安排的,虽说Python是相对比较简单的一门编程语言,但是没有基础的同学还是要进行系统的学习,那么Python入门基础知识学什么呢?来看看下面小编的详细介 ...

  7. C语言入门基础知识有哪些?

    众所周知C语言经久不衰,并且很多人都想要成为C语言工程师,为了能够做好C语言技术学习,需要知晓C语言入门基础知识有哪些. 用一个简单的C程序例子,介绍C语言的基本构成.格式.以及良好的书写风格,使小伙 ...

  8. Windows通用克隆系统入门基础知识简介

    Windows通用克隆系统入门基础知识简介 这里的Windows是指微软的Windows 2000/XP/2003(后文中未经说明的,凡是Windows均指这三种系统):所谓的通用克隆,俗名万能克隆, ...

  9. 数据库入门理论知识介绍以及编译安装MySql

    数据库入门理论知识介绍以及编译安装MySql 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 前言: 1.目前90%以上的公司面临的运维的瓶颈都在后端 最常见的2大瓶颈就是: 1&g ...

最新文章

  1. ASP.NET AJAX示例程序:实现IDragSource和IDropTarget接口将商品拖放至购物车中
  2. 隐藏画质代码_如何让千元机高画质满帧吃鸡?最全教程奉上!
  3. vcpkg —— VC++ 打包工具
  4. matlab交流电源并联,交流电路串联谐振和并联谐振的仿真分析
  5. 聚类分析(Clustering Analysis)
  6. .Net Micro Framework 快速入门
  7. java创建和销毁一个对象_有效的Java –创建和销毁对象
  8. C++ 第三方常用网络库
  9. 腾讯云一口气发布四大新品,云原生时代将正式开启
  10. 云漫圈 | 容器技术docker应用场景解析
  11. floating输入 高阻输入_STM32 GPIO八种输入输出模式
  12. tex 表格内容换行_LaTeX:表格内换行与各种居中完美解决
  13. 世界十大工业自动化公司排名
  14. 0017 求正方体的体积与表面积
  15. 赢在互联网的起跑线上
  16. unity avprovideo插件的使用
  17. [poj1797] Heavy Transportation
  18. iOS HTTPS证书不受信任解决办法
  19. MATLAB中实现多个点到某一点欧式距离计算方法
  20. 域名解析、域名空间绑定,两种截然不同概念

热门文章

  1. 使iPhone手机持续振动
  2. Linux网络性能评估工具iperf
  3. 提高云计算中的软件质量
  4. Style Report中报表组件的使用场景简析
  5. Solaris 默认Shell 修改
  6. ^l手动换行符 ^p段落标记符 /n/r_/n
  7. FineReport搭建物流报表平台的解决方案
  8. CSS3学习手记(1) 选择器
  9. jquery设置属性值或移除属性
  10. ubuntu9.10安装文泉驿微米黑字体