搭建基于Python的数字图像识别系统(一)
摘要
手写数字识别隶属于机器学习领域中的分类学习任务,Geoffrey Hinton将之称为“机器学习的果蝇”。本文旨在讨论搭建基于Jupyter Notebook环境的手写数字图像识别系统。首先, 本文讲述了JupyterLab的安装和使用方法;然后,本文讲述了手写数字图像的算法基础;接着,本文讨论了对MNIST数据集进行识别的项目搭建分析;最后提出了该系统的实践意义。
系统背景
Python是一种解释型、面向对象、动态数据类型的高级程序语言。Python由Guido van Rossum于1989年底发明,第一个公开发行版发行于1991年。像Perl语言一样,Python源代码同样遵循GPL,即GNU General Public License协议。Python的安装相当容易,并且在Linux和Mac的机器上都是包含Python语言的安装。
JupyterLab是一个基于web网页的,提供Jupyter notebook、代码和数据功能的交互式开发环境。它能够让你处理文档,以及以一种集灵活性、集成性和拓展性的方式处理诸如Jupyter notebook、文字编辑、终端和用户自定义模块。你能够在工作区间使用tab和spliter制作多个端对端的文档和工作流程。这些文档和工作流程相互协作,以致于交互计算,比如说,代码终端,基于Kernel的文档,笔记,和多样化的视图。
手写数字识别基于机器学习领域中的分类任务。而科技是第一生产力,信息技术作为科技领域的重要组成部分,得到了全球范围的重视和大力发展。以物联网技术为例,美国、欧盟、日本和韩国等发达国家对其都投入了大量的资金与技术研究力量[1],以实现各自的战略计划。
日新月异的信息技术变革了我们的生活方式和工作方式,给我们带来了便利,也给我们带来了挑战。物联网技术、云计算技术的兴起,伴随着大数据的涌现。对海量数据进行分析,挖掘其数据价值的需求被提到案上。
机器学习作为一门基于学习算法的、将数据转换为信息的学科,在信息技术的各大领域中均大有作为。从垃圾邮件检测且自动归入垃圾文件夹,到信件的手写邮政编码识别且信件地区归类,这些初级的应用都可体现机器学习在生活和工作中的价值。
机器学习算法有两大类,一是Supervised Learning Algorithms(监督学习算法),另一类是Unsupervised Learning Algorithms(非监督学习算法)。按照这种分类,机器学习算法的任务可相应地归为两类:一类是学习原有数据,以产生正确的预测数据;另一类是对数据集进行聚类分析。它们的应用可涉及至地震预测预报、恶性癌细胞预测、新闻信息相关类聚类、社交网络分析、计算机群组管理和天体学数据分类等。其前景应用相当地广泛和切实。
NIST,即National Institute of Standards and Technology,是收集手写数字数据MNIST的机构,M代表修改的,为更容易地与机器学习算法一起使用,MNST数据集是经过预处理的。如下图,
手写数字识别系统面临的问题有几类:数据预处理流程的规范性,数据容量的大小,手写数字识别的精度性,以及手写数字识别系统的稳定性和可拓展性。
一般而言,系统的开发有赖于系统的完整性,也尽管我们大多数认为能够存在一个系统如同一枚远离失败信息系统的“银弹”,但基于现实基础,我们必须承认开发完全成功的信息系统的“银弹”在大多数场景下是难以实现的。面对此类状况,本文的目的在于使用机器学习领域中神经网络算法提高手写数字识别系统的精度,并且开发具有完整性的信息系统,以提高项目的成功概率。手写数字识别系统的首要目标不是开发一个惊人的信息系统,而是为社会生产创造价值。对多数企业而言,分析开发一个出色的系统仅仅是达到其增加收益的目标工具。假使我们清楚地理解所开发的系统如何支持组织的目标和价值观,那么,顺其而然地当前业务连同其他信息系统就会对企业本身输出有价值的、有影响力的增长收益。
搭建基于Python的数字图像识别系统(一)相关推荐
- NVIDIA专家实战演示,教你快速搭建基于Python的车辆信息识别系统
主讲人 | 何琨 英伟达 量子位编辑 | 公众号 QbitAI 随着智慧城市.自动驾驶的快速落地,车辆的检测和识别应用场景非常广泛,如车牌识别.车流统计.车辆属性识别等. 近日,在英伟达x量子位发起的 ...
- CV公开课报名 | 快速搭建基于Python的车辆信息识别系统
位来 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 时下,智慧城市和自动驾驶快速发展,车辆的检测和识别应用场景非常广泛,如车牌识别.车流统计.车辆属性识别等. 但是从0搭建一个精度高.速度快的 ...
- 基于Python的人工智能美颜系统
基于Python的人工智能美颜系统使用PyQt5模块搭建可视化界面,使用Dlib模型(shape_predictor_68_face_landmarks.dat)实现人脸关键点检测和定位,人脸美颜(美 ...
- python实现文件共享_基于Python的分布式文件共享系统的实现
龙源期刊网 http://www.qikan.com.cn 基于 Python 的分布式文件共享系统的实现 作者:朱亚林 纪宏伟 来源:<智能计算机与应用> 2015 年第 04 期 摘 ...
- 论题:基于深度学习的图像识别系统
本文为论题:基于深度学习的图像识别系统 的编写思路. 目录 摘要: 引言 2.深度学习技术及卷积神经网络原理 3.图像识别系统设计 4.实验评估与改进策略 5.改进策略及未来发展趋势 6.结论 摘要: ...
- matlab图形设计界面 文献翻译,毕业设计基于matlab的数字图像识别的设计与实现文献翻译V8.1(资料4)...
<[毕业设计]基于matlab的数字图像识别的设计与实现文献翻译.doc>由会员分享,可免费在线阅读全文,更多与<毕业设计基于matlab的数字图像识别的设计与实现文献翻译(V8.1 ...
- python商城系统_基于python的海鲜商城系统
20006 基于python的海鲜商城系统 运行视频.代码等: 链接:https://pan.baidu.com/s/1tw4Qvtcuwt7ys36M7HvLSg 提取码:1589 复制这段内容后打 ...
- python分布式存储系统_基于Python的分布式文件共享系统的实现
基于 Python 的分布式文件共享系统的实现 朱亚林 ; [期刊名称] <智能计算机与应用> [年 ( 卷 ), 期] 2015(005)004 [摘要] 大数据时代 , 信息的分享与传 ...
- python毕业设计开题报告-基于Python的教学互动系统的设计与实现开题报告
基于Python的教学互动系统的设计与实现开题报告 背景: 在各种信息技术与课堂的不断探索中,我们一直在寻找一个能提高教学效率的方式,同时可以发现要提高教学效率,在课堂教学中必不可少的就是师生间的互动 ...
- 基于python的分布式扫描器_基于python的服务器监测系统的设计
基于 python 的服务器监测系统的设计 高正 ; 徐浩 ; 余曼 [期刊名称] <电脑知识与技术> [年 ( 卷 ), 期] 2017(013)002 [摘要] 本文介绍了一种基于 P ...
最新文章
- 实施自动化测试的六个目标和意义
- 虚拟主机众多用途你心仪哪一项?
- 电脑屏幕倒过来该怎么办?
- Apollo注册到自己的Eureka注册中心+配置中心集群
- 火车票能不能选座_在火车站买火车票可以选座位吗?
- flash spi w25q128 w25q64 w25q32 w25q16 verilog fpga程序代码
- 《Multiplayer Game Programming》阅读笔记
- 九酷音乐真实地址解析
- contest14 CF160div2 oooxx oooxx ooooo
- 【应用推荐】如何选择适合自己的笔记应用?附热门笔记应用上手总结
- 数字去重(5种方法)
- 高质量软件中的7项自动化要求
- 在线汇编翻译、函数对比
- 苹果cmsV10 MXone Pro自适应2.0影视模板源码下载
- 战略游戏(树形dp)
- 前端文件预览 (pdf ppt word Excel image mp4 txt )集成预览
- 有关视频的一些常用名词解释
- SQL2012连接不上服务器
- 网站1g流量服务器够用吗,4G网的1G流量到底能用多久?
- Fedora17硬盘安装
热门文章
- LeapFTP访问WinXP上的文件
- 如鹏网.Net三层架构 第四章代码生成器
- 苹果6s强制删除id锁_付费苹果解锁软件 屏幕解锁及AppleID解锁
- 差点以为是本人!这个3D人体生成模型厉害了,还能自己改POSE
- 揭秘淘宝286亿海量图片存储与处理架构,海量小文件存储的解决方案
- 手机热点总是正在连接服务器,电脑连接手机热点无法上网的三种解决方法
- USB计算机连接只能充电,手机连接不上电脑只显示充电怎么办
- java 原子量_Java线程:原子量
- “word另存为PDF时,参考文献的上标都变为正常文本“的解决办法
- android判断极光推送是不是注册成功,android极光推送用户怎么注册sdk