模式识别是什么?

作为人工智能的一个重要方向,模式识别的主要任务是模拟人的感知能力,如通过视觉和听觉信息去识别理解环境,又被称为“机器感知”或“智能感知”。

人们在观察事物或现象的时候,常常要寻找它与其他事物或现象的不同之处,并根据一定目的把相似、但又细节不同的事物或现象组成一类。字符识别就是一个典型的例子,如数字“4”可以有各种写法,但都属于同一类别。人脑具有很强的模式识别和推广能力,即使对于某种不同写法的“4”,以前虽未见过,也能把它分到“4”所属的这一类别。人脑的这种对模式(事物、现象等)进行归类和分类的能力,就是模式识别,也就是感知能力。

随着20世纪40年代电子计算机出现,50年代人工智能兴起,模式识别在20世纪60年代初迅速发展成为一门新学科。21世纪以来,模式识别又逐渐与深度学习融合。近年来,深度学习和大数据的出现推动了模式识别的快速发展。

对此,刘成林解释道,“模式识别是一个智能任务,是人工智能的一种形式。机器学习,包括深度学习是模式识别背后的基本方法,通过学习(训练)使机器具备识别模式的能力。当前,用深度学习的方法来实现模式识别,能更好的解决问题。”

深度学习作为机器学习的一种,是对生物神经网络结构和信息处理机制的简单模拟。人工神经网络早在上世纪40年代就有人研究,50年代和80年代都曾产生较大的影响。近年来,随着计算能力的提升,可以训练层数较多的神经网络(称为深度神经网络)来提升数据拟合和识别能力,有的甚至达到了1000多层。深度学习一般就是指利用深度神经网络来进行学习。

复杂条件下,人脸识别的正确率不到50%

得益于深度学习,目前人脸识别和文字识别都是人工智能领域应用比较成功的方向,可以算是模式识别借助深度学习形成的主要研究成果之一。

但刘成林认为,目前人脸识别、文字识别虽然已应用得较为广泛,但还不能算“应用得很好”。人脸识别目前应用得比较成熟的是门禁、通关等领域,原因在于被识别的对象能主动配合,距离摄像头较近,能拍摄到比较清楚的图像。很多厂商在用户配合、光照可控的场景下人脸识别正确率能达到99%以上。但在更加复杂的情况下,如在室外光照不均、距离远、人脸视角多变情况下,用监控摄像头进行人脸识别,识别正确率就会明显降低。

目前在计算机前端加入AI模块,只能起辅助作用,复杂条件下的人脸识别依旧难以达到成熟应用的程度。刘成林表示,室外自然光照条件下,“人脸识别正确率还达不到50%”。

文字识别领域也是如此。文字识别目前主要应用在书籍和报纸等的数字化上。报纸、金融机构、保险机构以及快递行业的的大量单据,都需要电子化后才能方便检索、管理和进行大数据分析。司法界推行智能法务,办案的文书(有印刷体,也有手写体)需要电子化。医院的病例、教育领域的作业题、考试答卷等,也都有很大的电子化需求。

同人脸识别一样,图像清晰度和光照等问题也是文字识别的一大难点。平板扫描仪由于光照均匀,对纸质材料扫描得到的图像清晰度高,文字识别率较高。而拍照图片的识别率则会降低,室外自然场景图片中的文字检测和识别更是当今研究的热点和难点问题。

对抗学习、脑科学并肩,加速AI进程

要克服人脸识别中低分辨率和光照的问题,深度学习也存在局限,而运用对抗学习的方法来处理图像则能提高其清晰度或生成更多样本。

什么是对抗学习?

对抗学习是一种很新的机器学习方法,由加拿大学者Ian Goodfellow首先提出。对抗学习实现的方法,是让两个网络相互竞争对抗,“玩一个游戏”。其中一个是生成器网络,它不断捕捉训练库里真实图片的概率分布,将输入的随机噪声转变成新的样本(也就是假数据)。另一个是判别器网络,它可以同时观察真实和假造的数据,判断这个数据到底是不是真的。通过反复对抗,生成器和判别器的能力都会不断增强,直到达成一个平衡,最后生成器可生成高质量的、以假乱真的图片。

文字识别领域要解决的问题,除了上文提到的拍照图片、以及手写笔迹的识别,小样本条件下的文字识别,如古籍的识别也是一大挑战,因为用于训练的标记样本不足,深度学习难以取得较高的识别率。

小样本泛化性、自适应性、可解释性、鲁棒性是当前以深度学习为主的模式识别技术的主要局限所在,而这些恰恰是人脑的长处。因此,模式识别可以从脑科学和神经科学上寻找新的借鉴,发展新的类人感知和认知机理的模式识别学习理论与方法。

以泛化能力为例,在训练样本较少时,可以设计与人的记忆方式类似的模型进行训练,使机器记住文字的结构和关键特征,如构成文字的笔画、组合和关系。这种模型叫“生成模型”,可以记住每一类模式的关键特征及分布,并能生成数据,如生成满足一类文字基本结构、细节不同的手写字。生成模型也具有很好的解释性,在识别模式的同时能解释这个模式是由哪几部分构成的,几部分之间是什么关系。

模式识别、深度学习、对抗学习、脑科学……越来越多的人工智能研究路径进入了我们的视野。而对于人工智能发展的未来,刘成林也认为,深度学习依然会是人工智能研究的主流,但对抗学习、脑科学、认知科学等的理论方法,都会与其进行融合,共同推进人工智能的发展。

Hebbian Theory-Hebbian学习:Hebbian学习是一种神经科学理论,它认为突触后细胞敏感度的增加源于突出前细胞对突出后细胞反复或者持续的刺激。这一理论解释了突触的可塑性,即学习过程中大脑神经元的适应性,也对人工神经网络的研究起到了重要的作用。它也可称为Hebb规则或Hebb假设

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
模式识别应用于哪些领域,模式识别技术的发展趋势

计算机视觉与图像处理、模式识别和机器学习,之间有什么关系?

模式识别具体是怎么定义的,主要研究方向是什么?


多智时代-人工智能和大数据学习入门网站|人工智能、大数据、物联网、云计算的学习交流网站

什么是模式识别,对抗学习是什么?相关推荐

  1. 对抗机器学习和对抗学习

    机器学习近年来在许多方面取得了巨大的成功,但是安全性问题却一直没有得到人们的重视.这里把他们二人提出的问题定义为机器学习的安全和隐私问题. 对抗机器学习(Adverserial Machine Lea ...

  2. AI之强化学习、无监督学习、半监督学习和对抗学习

    1.强化学习 文章目录 1.强化学习 1.1 强化学习原理 1.2 强化学习与监督学习 2.无监督学习 3.半监督学习 4.对抗学习 强化学习(英语:Reinforcement Learning,简称 ...

  3. 对抗学习用于目标检测--A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

    A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection CVPR 2017 Caffe code : http ...

  4. ICLR 2019计算机视觉、NLP、图模型、对抗学习、表示学习和元学习

    https://www.toutiao.com/a6703123631590867459/ 原作者:Marina Vinyes 深度学习与NLP编译 关键词:Computer Vision, Natu ...

  5. 深度对抗学习在图像分割和超分辨率中的应用

    原文:http://blog.csdn.net/shenziheng1/article/details/72821001 深度对抗学习在图像分割和超分辨率中的应用 原创 2017年05月31日 16: ...

  6. 直播 | ACL 2021论文解读:基于对抗学习的事件抽取预训练模型

    「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果.我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和 ...

  7. UC Berkeley提出变分判别器瓶颈,有效提高对抗学习平衡性

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  8. 论文浅尝 - WWW2020 | 通过对抗学习从用户—项目交互数据中挖掘隐含的实体偏好来用于知识图谱补全任务...

    笔记整理 | 陈湘楠,浙江大学在读硕士. 现有的知识图谱补全方法都在试图设计全新的学习算法,来使用已知的事实信息去推理知识图谱中的潜在语义.但随着知识图谱的广泛使用,知识图谱中的许多实体对应着应用程序 ...

  9. 论文浅尝 | 基于对抗学习的弱监督知识图谱对齐

    论文笔记整理:郭凌冰,浙江大学研究助理,研究方向为知识图谱的表示学习. 绝大部分现有的知识图谱对齐方法都要求足够的已对齐三元组作为监督数据,但在现实世界中,获取大量的对齐三元组的代价十分高昂.本文提出 ...

最新文章

  1. OO实现ALV TABLE 七:ALV的选择功能
  2. 求1+2+3+...+n,要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句(A?B:C)
  3. csv python 图片 存_Python读取CSV文件并存储到MySQL
  4. 2021大数据1班《Python程序设计基础》学生学期总结
  5. 二重循环~~for循环
  6. CS0579 Duplicate 'Microsoft.AspNetCore.Mvc.ApplicationParts.ProvideApplicationPartFactoryAttribute
  7. selenium 点击后没反应未报错_Selenium代码迁移时会出现哪些问题?(附解决方案)...
  8. 面向对象(Python):学习笔记之类属性和类方法
  9. LINUX 版本信息查看(全)
  10. Thinkpad蓝牙键盘驱动安装和常见问题
  11. Ubuntu 印象笔记网页剪切插件无法登录问题的一种解决方案
  12. matlab空间计量AIC准则,空间计量经分析课件.ppt
  13. private111
  14. pythondjango学生信息管理系统_Django实现学员管理系统
  15. COLLATE LOCALIZED ASC 按本地语言进行排序
  16. php html 纯文本,php – 使用纯文本回退发送HTML简报
  17. 如何避免“Windows Defender SmartScreen阻止无法识别的应用程序启动警告”
  18. 2_计算机网络_数据链路层-交换机-以太网-vlan-trunk
  19. 抖音播放量突然被限流降权是什么原因
  20. 【Spark深入学习 -10】基于spark构建企业级流处理系统

热门文章

  1. 【JZOJ2109】清兵线【dp】
  2. 理性看待 数据分析师 Hot!
  3. cadence中一些常见英文的含义
  4. vue-cropper图片裁剪网络图片展示时跨域
  5. 计算机启动后只有鼠标桌面黑屏,电脑开机黑屏只有鼠标的解决方法
  6. 前端程序员开发技术栈(前端干货)
  7. 苹果youtube无法连接网络_解决苹果手机Apple ID被禁止下载或无法连接到AppStore等问题...
  8. 最新WordPress微信小程序社区论坛源码多端应用
  9. 微信小程序require报错
  10. Nyoj 954 N!