模式识别是什么?

  作为人工智能的一个重要方向,模式识别的主要任务是模拟人的感知能力,如通过视觉和听觉信息去识别理解环境,又被称为“机器感知”或“智能感知”。

  人们在观察事物或现象的时候,常常要寻找它与其他事物或现象的不同之处,并根据一定目的把相似、但又细节不同的事物或现象组成一类。字符识别就是一个典型的例子,如数字“4”可以有各种写法,但都属于同一类别。人脑具有很强的模式识别和推广能力,即使对于某种不同写法的“4”,以前虽未见过,也能把它分到“4”所属的这一类别。人脑的这种对模式(事物、现象等)进行归类和分类的能力,就是模式识别,也就是感知能力。

  随着20世纪40年代电子计算机出现,50年代人工智能兴起,模式识别在20世纪60年代初迅速发展成为一门新学科。21世纪以来,模式识别又逐渐与深度学习融合。近年来,深度学习和大数据的出现推动了模式识别的快速发展。

  模式识别是一个智能任务,是人工智能的一种形式。机器学习,包括深度学习是模式识别背后的基本方法,通过学习(训练)使机器具备识别模式的能力。当前,用深度学习的方法来实现模式识别,能更好的解决问题。

  深度学习作为机器学习的一种,是对生物神经网络结构和信息处理机制的简单模拟。人工神经网络早在上世纪40年代就有人研究,50年代和80年代都曾产生较大的影响。近年来,随着计算能力的提升,可以训练层数较多的神经网络(称为深度神经网络)来提升数据拟合和识别能力,有的甚至达到了1000多层。深度学习一般就是指利用深度神经网络来进行学习。

  复杂条件下,人脸识别的正确率不到50%

  得益于深度学习,目前人脸识别和文字识别都是人工智能领域应用比较成功的方向,可以算是模式识别借助深度学习形成的主要研究成果之一。

  目前人脸识别、文字识别虽然已应用得较为广泛,但还不能算“应用得很好”。人脸识别目前应用得比较成熟的是门禁、通关等领域,原因在于被识别的对象能主动配合,距离摄像头较近,能拍摄到比较清楚的图像。很多厂商在用户配合、光照可控的场景下人脸识别正确率能达到99%以上。但在更加复杂的情况下,如在室外光照不均、距离远、人脸视角多变情况下,用监控摄像头进行人脸识别,识别正确率就会明显降低。

  目前在计算机前端加入AI模块,只能起辅助作用,复杂条件下的人脸识别依旧难以达到成熟应用的程度。刘成林表示,室外自然光照条件下,“人脸识别正确率还达不到50%”。

  文字识别领域也是如此。文字识别目前主要应用在书籍和报纸等的数字化上。报纸、金融机构、保险机构以及快递行业的的大量单据,都需要电子化后才能方便检索、管理和进行大数据分析。司法界推行智能法务,办案的文书(有印刷体,也有手写体)需要电子化。医院的病例、教育领域的作业题、考试答卷等,也都有很大的电子化需求。

  同人脸识别一样,图像清晰度和光照等问题也是文字识别的一大难点。平板扫描仪由于光照均匀,对纸质材料扫描得到的图像清晰度高,文字识别率较高。而拍照图片的识别率则会降低,室外自然场景图片中的文字检测和识别更是当今研究的热点和难点问题。

人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,有兴趣的朋友,可以查阅多智时代,在此为你推荐几篇优质好文:

1.人工智能时代,AI人才都有哪些特征?

http://www.duozhishidai.com/article-1792-1.html

2.大数据携手人工智能,高校人才培养面临新挑战

http://www.duozhishidai.com/article-7555-1.html

3.人工智能,机器学习和深度学习之间,主要有什么差异

http://www.duozhishidai.com/article-15858-1.html

人脸识别、文字识别背后的方法,以及研究的热点和难点相关推荐

  1. 如何拍照识别文字?试试这个方法

    不知道小伙伴们有没有发现,随着智能手机的普及,我们好像已经习惯于看到有用的或者有趣的东西就拿起手机拍下来. 我之所以有这种感受是因为在期末考试前的一周,我发现我的书上几乎没有笔记,平时上课都是用手机拍 ...

  2. 如何快速拍照识别文字?有这个方法不用担心不够快了

    今天我来跟大家聊一个很有用的话题,就是拍照识别文字.在生活中很多地方我们经常会去使用拍照识别文字,比如当我们在工作中需要把一张图片内的很多文本信息变成可以复制粘贴的文本,这难道要我们一个一个的手动记录 ...

  3. python视觉识别字_Python怎么识别文字?正确 的方法详解

    爬虫--文字识别 机器视觉 从Google的无人驾驶汽车到可以识别假钞的自动售卖机,机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域. 这里我们将重点介绍机器视觉的一个分支:文字识别.介 ...

  4. Python怎么识别文字?正确的方法详解

    爬虫--文字识别 机器视觉 从Google的无人驾驶汽车到可以识别假钞的自动售卖机,机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域. 这里我们将重点介绍机器视觉的一个分支:文字识别.介 ...

  5. 中文验证码识别 java_opencv Tesseract 验证码识别 文字识别

    环境搭建 安装Tesseract 下载64位 安装时可以选择语言包一路next 加入path环境变量后,查看是否成功,pycharm需要重新启动,否则找不到 C:\Program Files (x86 ...

  6. ABBYY15免费照片识别文字识别软件

    照片识别文字的软件有哪些?在日常的工作的时候,小伙伴们是不是经常会借助拍摄照片记录一些比较重要的事情或者是一些比较重要的笔记,等回头空闲出来的时候在去整理,那么这时候,如果我们运用好图片识别文字这项技 ...

  7. C# 通用OCR识别 文字识别 中文识别

    软件说明 基于以下两个开源项目,做了再次封装 https://github.com/paddlepaddle/PaddleOCR PaddleOCRSharp: 本项目是一个基于PaddleOCR的C ...

  8. php 点对点,浅析点对点(End-to-End)的场景文字识别

    一.背景 随着智能手机的广泛普及和移动互联网的迅速发展,通过手机等移动终端的摄像头获取.检索和分享资讯已经逐步成为一种生活方式.基于摄像头的(Camera-based)的应用更加强调对拍摄场景的理解. ...

  9. python 百度ocr识别_Python使用百度Ocr识别文字保存CSV

    1.准备: 1)Python开发环境, 笔者用的是3.7; 工具用的是Pycharm 2)百度云后台创建文字识别的应用, 获取AppID, API key, Secret Key 百度云后台创建文字识 ...

最新文章

  1. 【mysql】--MHA+Atlas
  2. Web性能优化系列(1):Web性能优化分析
  3. 数学物理方法pdf_《数学物理方法》周明儒(第2版)补充材料与习题详解
  4. 数据表现层文件命名参考
  5. ural1297 后缀数组+RMQ
  6. 非网络引用element-ui css导致图标无法正常显示的解决办法
  7. 通过Yeoman快速搭建AngularJS webapp应用的实践
  8. 外设驱动库开发笔记23:AT24Cxx外部存储器驱动
  9. 【51nod 1331】狭窄的通道
  10. java 程序执行原理
  11. 渲染标签文字(光晕效果)
  12. linux红帽认证考试费,红帽rhce认证考试费用是多少?
  13. mysql 主键B+Tree 3层存2000W行数据
  14. 抛开时代背景,任何技术讨论都是瞎耽误功夫
  15. SHFileOperation 操作文件,本例拷贝文件
  16. dnf怎么显示连接服务器失败怎么回事,登录DNF显示连接不到服务器怎么办 服务器连接失败解决方法...
  17. 知识分享!什么是中继器?-道合顺大数据Infinigo
  18. Java实现 已知ListString list = new ArrayListString();list .add(张三丰,北京);......要求:求出每个地区有多少人,都是谁?
  19. python学习资源整理
  20. 【机器学习】一文读懂正则化与LASSO回归,Ridge回归

热门文章

  1. Excel VBA解析JSON数据
  2. php去除正方教务空格,通用型正方教务(通杀各版本)存在注入(不需
  3. BLE配对绑定过程梳理
  4. 智能车图像处理(一)阈值处理
  5. jQuery保留两位小数
  6. 自动化Web页面性能测试介绍
  7. Macos File Zilla 乱码 的解决方法
  8. Python三大神器和csv文件操作
  9. Ubuntu开启root登录
  10. linux配置虚拟IP--VIP