自然语言处理入门(一)
概念
(Natural Language Processing, 简称NLP)就是利用电子计算机为工具对人类特有的书面形式和口头形式的自然语言的信息进行各种类型处理和加工的技术,这种技术现在已经形成一门专门的边缘性交叉性学科,它涉及语言学、数学和计算机科学,横跨文科、理科和工科三大知识领域。自然语言处理的目的在于建立各种自然语言处理系统,如机器翻译系统、自然语言理解系统、信息自动检索系统、信息自动抽取系统、文本信息挖掘系统、术语数据库系统、计算机辅助教学系统、语音自动识别系统、语音自动合成系统、文字自动识别系统等。
自然语言是人类区别于其它动物的重要标志之一。人借助于自然语言交流思想,达到互相了解,组成人类社会生活;人还借助于自然语言进行思维活动,认识事物的本质和规律,创造了人类的物质文明和精神文明。
自然语言起码在下面四个方面与人工语言大相径庭:
(1) 自然语言中充满着歧义,而人工语言中的歧义则是可以控制的;
(2) 自然语言的结构复杂多样,而人工语言的结构则相对简单;
(3) 自然语言的语义表达千变万化,迄今还没有一种简单而通用的途径来描述它,而人工语言的语义则可以由人来直接定义;
(4) 自然语言的结构和语义之间有着千丝万缕的、错综复杂的联系,一般不存在一一对应的同构关系,而人工语言则常常可以把结构和语义分别进行处理,人工语言的结构和语义之间有着整齐的一一对应的同构关系。
自然语言处理的发展
- 基于句法-语义规则的理性主义方法受到质疑,随着语料库建设和语料库语言学的崛起,大规模真实文本的处理成为自然语言处理的主要战略目标,概率和数据驱动的方法几乎成为了自然语言处理的标准方法。
- 自然语言处理越来越多的使用机器自动学习的方法来获取语言知识
- 统计数学越来越受到重视
- 自然语言处理中越来越重视词汇的作用,出现了强烈的“词汇主义”的倾向。
- 多语言在线自然语言处理技术迅猛发展。随着网络技术的发展,互联网(Web)逐渐变成一个多语言的网络世界,互联网上的机器翻译、信息检索和信息抽取等自然语言处理的需要变得更加紧迫。
自然语言处理的常见运用
信息提取
如下面的这段话:Hi Dan, we’ve now scheduled the curriculummeeting. It will be in Gates 159 tomorrow from10:00-11:30.-Chris
我们通过自然语言处理能够得出如下信息:
Event: Curriculum mtg Date: Dec-18-2017 Start: 10:00am End: 11:30am where: Gates 159
语义分析
比如淘宝某个商品的评价,我们能够提取信息,并且根据语义来进行测评.
比如对于一个照相机
提取出如下的主要特征:zoom ,affordability, size and weight, flash ,ease of use
我们根据语义分析,搜集到关于大小和重量的如下三个评价:
1. 拿起来很好很舒适
2. 好轻的照相机,我再也不用拿着又大又笨的机器到处跑了.
3. 这个照相机太娇嫩了,拿在手上必须非常小心.
再进一步的,通过NLP,我们可以得出前两个是好的评价,最后一个是不好的.
通过这些,我们就可以对这款相机做一些基于NLP的测评指标。自动翻译.
谷歌翻译、百度翻译、网易云翻译等等就是实例.
工欲善其事,必先利其器
自己最近爱上了自然语言处理、机器翻译、人工智能,看了老师推荐的《计算机自然语言处理》,真的是云里雾里,不能说都看不懂,但是没有get到有层次的东西,所以自己在网站各个博客、社区,知乎、github上看了一些关于自然语言处理入门的讲解或者简述,了解了一些之后,我其实觉得,自然语言处理就是机器学习。自己根据了解的情况写了这篇杂记,也安排了自己的一个学习计划:
- 《计算机自然语言处理》——上面分词规范特别学习,跟着看一些python在自然语言处理上的应用源码,多看源码在github上,多在练习中更加深刻理解自然语言处理的思想;
- 编程语言我用的是python
现阶段先学习这些写吧,眼看就要考试了,期间看看《数学之美》,应该会很不错。
感觉还是云里雾里。~~~~!
自然语言处理入门(一)相关推荐
- 《自然语言处理入门》不是 NLP 学习路上的万能药
<自然语言处理入门>是图灵 2019 年 10 月出版的一本 NLP 领域的入门图书,作者是何晗(网名 hankcs,HanLP 作者.「码农场」博客博主).图书上架之后得到了广大的读者的 ...
- 【实战教程】NLP-Beginner:自然语言处理入门练习
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 今天给大家分享一门很好的NLP入门学习实战仓库,话不多说,学它!!! 此项目完成了 ...
- NLP汉语自然语言处理入门基础知识介绍
NLP汉语自然语言处理入门基础知识介绍 自然语言处理定义: 自然语言处理是一门计算机科学.人工智能以及语言学的交叉学科.虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部 ...
- NLP-Beginner:自然语言处理入门练习-任务一
NLP-Beginner:自然语言处理入门练习 任务一:基于机器学习的文本分类 深度学习项目,在训练之前,一般均会对数据集做shuffle,打乱数据之间的顺序,让数据随机化,这样可以避免过拟合. Ba ...
- HanLP《自然语言处理入门》笔记--5.感知机模型与序列标注
笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 5. 感知机分类与序列标注 第4章我们利用隐马尔可夫模型实现了第一个基于序列标注的 ...
- HanLP《自然语言处理入门》笔记--1.新手上路
文章目录 1. 新手上路 1.1 自然语言与编程语言的比较 1.2 自然语言处理的层次 1.3 自然语言处理的流派 1.4 机器学习 1.5 语料库 1.6 开源工具 1.7 总结 1.8 GitHu ...
- python自然语言处理入门教程(一)
1.NLTK自然语言处理工具包 1.1 NLTK简介 NLTK是构建Python程序与人类语言数据工作的主要平台.它提供了易于使用的界面,以超过50语料库和词汇资源,如WordNet的,连同一套文字处 ...
- 《自然语言处理入门》笔记
目录 第一章 新手上路 1.1自然语言与编程语言 1.1.1词汇量 1.1.2结构化 1.1.3歧义性 1.1.4容错性 1.1.5易变性 1.1.6简略性 1.2自然语言处理的层次 1.2.1语音. ...
- Python NLTK 自然语言处理入门与例程
Python NLTK 自然语言处理入门与例程 在这篇文章中,我们将基于 Python 讨论自然语言处理(NLP).本教程将会使用 Python NLTK 库.NLTK 是一个当下流行的,用于自然语言 ...
最新文章
- 苹果如果无法弹出⏏️
- 2021 三月1日雅思口语考试反思
- 开设计算机课程的必要性,学前教育专业开设计算机音乐制作课程的必要性与可行性...
- 基础知识(十)C++常用函数.txt
- matlab 判断元素索引_MATLAB图像处理:08:在交通视频中检测汽车
- 关于Chrome内核88版本无法正常使用Adobe Flash Player公告
- rocketmq集成boot
- 如何在Windows上运行Redis?
- 测试对等网络的连通性
- 【Python机器学习及实践】笔记
- 《Blender权威指南》
- 2022年网络规划设计师最新考纲变化
- 寻找百度图片搜索接口历程--one
- 企鹅智库《2019-2020中国互联网趋势报告》
- PMBOK 7th管理模型介绍系列--五分钟了解情境领导力
- 互调失真 ,P1dB 压缩点,三阶交调截止点
- amazon开发者申请,pii权限申请
- 杨辉三角 c语言 二维数组
- python称号_Python成为2018年度编程语言,遥遥领先于其他语言
- 事业单位和公务员的面试方式有什么区别?