如何用 Python 进行基于深度学习的计算机视觉项目开发?
令人惊喜的“智能”年代
深度学习有着广阔的前景
我们正处在一个“智能”的年代,比如智能手机中的语音助手、机器翻译和人脸识别;战胜过日本将棋冠军、国际象棋冠军, 2017 年又打败世界围棋冠军的棋类AI;以及即将实用化的无人驾驶智能汽车。原来被认为不可能实现的事情,人工智能正一步一步地帮助我们实现。在这个让人惊喜的世界里,深度学习技术发挥着至关重要的作用,在很多人没有注意到的地方,深度学习正在潜移默化地改变着人们的工作和生活。目前,深度学习已经在计算机视觉、自然语言处理和语音识别等领域得到广泛的应用,同时正在向教育、医疗、金融及制造等领域渗透,各行各业也都在招揽掌握了深度学习技术的人才。
“异军突起”的深度学习
高效上手的计算机视觉项目开发
我有着多年的计算机视觉研究经验,在这个领域中,深度学习正在逐步取代“人工特征+机器学习”的传统视觉算法。其中的原因主要有两方面:一方面是深度学习在很多任务上实现了超出传统算法的精度,另一方面是传统视觉算法中的“人工特征”需要大量的经验以及对任务和数据的深刻理解,而深度学习能够根据数据自行学习如何提取特征,极大地降低了机器视觉任务的难度。
深度学习技术正在快速发展,每年都会出现很多新的优秀算法,但是这些算法越来越复杂,对于初学者来说,跟进最新的研究成果变得越来越难。我观察到很多用户非常关注深度学习,并且对 PyTorch 有着很大的兴趣,可惜相关资料太过晦涩难懂,难以入门。为了让读者能够更好地理解深度学习的思维,学会使用深度学习工具,我写了这本《Python计算机视觉与深度学习实战》。
这本书立足实践,从机器学习的基础技能出发,深入浅出地介绍了如何使用 Python 进行基于深度学习的计算机视觉项目开发。开篇首先介绍了基于传统机器学习及图像处理方法的计算机视觉技术;然后重点就图像分类、目标检测、图像分割、图像搜索、图像压缩及文本识别等常见的计算机视觉项目做了理论结合实践的讲解;最后探索了深度学习项目落地时会用到的量化、剪枝等技术,并提供了模型服务端部署案例。
一本超简单的计算机视觉书
从零到一搭建优美的深度学习模型
基础讲解+项目实例
在基础讲解部分,我们为读者介绍了 scikit-learn 和 PyTorch 两个库的组成模块,以及每个模块能解决的问题,通过编程实验对深度学习理论进行展示,让读者能够摆脱复杂难懂的数学公式,在编程的过程中直观理解深度学习领域晦涩的原理。
在项目实例部分,为了帮助初学者快速了解深度学习中的一些细分领域(如目标检测、图像分割、生成对抗网络等)的技术发展现状,本书对相应领域的经典算法进行了介绍,并根据经典算法的思路,针对性地设计了适合初学者学习的实例项目。这些项目去除了算法中的烦琐细节,仅保留最基础的逻辑,力求让读者在编写代码之前,更好地理解任务思路。我们为读者挑选了很多在工业界有实际应用场景的深度学习项目,重点介绍它们的思路以及代码实现。
3 种代码形式
为了方便读者的学习,本书中的代码有下面 3 种形式。
小型实验样例采用命令行形式编写,每行代码前都会有“>>>”标记。
配图较多的实例使用 Jupyter Notebook 编写,在每一段代码前都有“In”标记。
实例项目采用项目文件的形式编写,章节开头会给出项目的目录结构,章节内的代码以文件为单位进行展示,代码的第一行标注所属文件的名称。
本书适合以下人群阅读
深度学习相关的科研工作者
计算机视觉从业者
想要了解深度学习技术的程序员
对深度学习感兴趣的其他读者
具备以下知识能更好地阅读本书
线性代数和数理统计知识
深度学习框架知识
书籍特色
《Python计算机视觉与深度学习实战》是一本超简单的计算机视觉书,教你从零到一搭建优美的深度学习模型,基于sklearn+PyTorch,以理论+实践方式介绍计算机视觉项目,适合有一定的Python 编程基础,初学深度学习的读者阅读。
作者介绍
郭卡
安徽外国语学院计算机讲师,省级自然科学基金重点项目“基于大数据与人工智能技术的在线学习评价系统”主持人,《Python 数据爬取技术与实战手册》主编,参与多项人工智能研究项目并发表相关论文两篇。
戴亮
科大讯飞算法工程师,GiantPandaCV 作者之一,主要研究方向为光学字符识别与语音识别,热衷于 PyTorch 技术分享,对深度学习相关技术有深入了解。
相关阅读推荐
— 深度学习真正意义上的入门书 —
— 实践中培养深度神经网络直觉 —
— 计算机视觉编程权威实践指南 —
— 一本书掌握深度学习的数学基础知识 —
现在购买
京东自营满100-50
满减叠券最高享
满400-260!
↓一键直达!
点个“在看”↓
如何用 Python 进行基于深度学习的计算机视觉项目开发?相关推荐
- 视频教程-基于深度学习的计算机视觉:原理与实践(上部)-计算机视觉
基于深度学习的计算机视觉:原理与实践(上部) 大学教授,美国归国博士.博士生导师:人工智能公司专家顾问:长期从事人工智能.物联网.大数据研究:已发表学术论文100多篇,授权发明专利10多项 白勇 ¥1 ...
- 视频教程-基于深度学习的计算机视觉: 原理与实践 (下部)-计算机视觉
基于深度学习的计算机视觉: 原理与实践 (下部) 大学教授,美国归国博士.博士生导师:人工智能公司专家顾问:长期从事人工智能.物联网.大数据研究:已发表学术论文100多篇,授权发明专利10多项 白勇 ...
- 基于深度学习的计算机视觉技术在无人驾驶中的应用
基于深度学习的计算机视觉技术在无人驾驶中的应用 背景 当前,人工智能是下一代信息技术的核心和焦点,而无人配送则是人工智能典型的落地场景,因为完成无人配送需要自动驾驶技术.机器人技术.视觉分析.自然语言 ...
- 基于深度学习的计算机视觉:原理与实践
基于深度学习的计算机视觉:原理与实践(上部) 基于深度学习的计算机视觉:原理与实践(下部) 本课程适合具有一定深度学习基础,希望发展为深度学习之计算机视觉方向的算法工程师和研发人员的同学们. 基于深度 ...
- YOLO车牌识别,基于深度学习YOLOv3,Yolov4开发,支持车辆车型识别
YOLO车牌识别,基于深度学习YOLOv3,Yolov4开发,支持车辆车型识别 ID:6999650911717802盐市口会玩的川乌
- 基于深度学习的计算机视觉垃圾分类系统
资源下载地址:https://download.csdn.net/download/sheziqiong/85709577 1. 实验介绍 1.1 实验背景 自今年 7 月 1 日起,上海市将正式实施 ...
- 商品识别系统Python,基于深度学习卷积神经网络
介绍 商品识别系统采用了Python.TensorFlow.ResNet50算法以及Django等技术栈.其中,Python作为主要的编程语言,它的清晰简洁的语法使得代码易于阅读和编写.TensorF ...
- 复杂交通环境感知 | 基于深度学习的计算机视觉方法综述
作者 | 黄浴 编辑 | 计算机视觉深度学习和自动驾驶 点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心[全栈算法]技术交流群 后台回复 ...
- 深度学习大厂前端项目开发全流程全流程
用户审美的要求越来越高,也就使得越来越多的公司和企业注重线上用户的体验,都想要向外界传达出众的气质形象和重要信息,所以,Web前端人员的需求也越来越大. 深度学习大厂项目开发全流程全流程 在国外企业, ...
最新文章
- 随机选取字母c语言,菜鸟求助,写一个随机输出26个英文字母的程序
- gan只用来生成是浪费
- python学习笔记:easygui的简单示例
- Jdbc访问mysql查询聚合函数_JDBC连接参数设置对Oracle数据库的影响分析
- 【Modelsim零基础入门】verilog仿真程序:1-bit A+B
- 导入时间过长,请求变成404,导入成功后后台会出现java.io.IOException: 您的主机中的软件中止了一个已建立的连接
- 检测php常量是否存在,php判断变量常量是否存在_PHP教程
- System verilog随机系统函数$urandom使用方法
- 《云计算:原理与范式》一3.4 SaaS范式面临的挑战
- cad标注桩号lisp_cad桩号标注插件下载
- 保护 iOS 用户数据安全: Keychain 和 Touch ID
- 道高一尺魔高一丈,记强大的boost regex
- pocketsphinx 模型库_PocketSphinx声学模型的训练与使用
- pip 如何查看一个包所有的历史版本
- windows 下端口转发 端口映射工具 passport
- 常用的100个PHP类库资源和技巧
- 下列属于usb转串口的芯片是_USB转串口芯片——FT232R
- win10 + uefi
- 炫龙笔记本毁灭者dc更换CPU记录
- 使用swagger报错:Exception encountered during context initialization - cancelling refresh attempt解决方法
热门文章
- python 怎么将数组转为列表_图片转换成pdf格式怎么操作?什么软件能将图片转为pdf?...
- 基于相关系数的影像匹配_智库丨陈晓勇:低空摄影测量立体影像匹配的现状与展望...
- 没有任何基础学编程从哪开始_没有任何的绘画基础,该怎么学绘画?
- ubuntu桌面_Ubuntu桌面自动更换bing每日壁纸
- linux tcp窗口大小设置,高性能Linux:TCP/IP内核参数调优之TCP窗口扩大因子(TCP Window Scaling)选项(理论篇)...
- sql针对某字段去重查询_sql针对某一字段去重,并且保留其他字段
- vue 2.0 filter html,vue.filter使用方法是什么
- 注塑机摆放间距多少合适_红木家具之间正确的摆放距离
- python是用c 写的吗_我能用python写一个c语言出来吗?
- hive同时不包含一些字符串_Hive中常用的字符串操作