3.2 特征点检测

神经网络可以通过输出图片上特征点的(x,y)坐标,来实现对目标特征的识别

我们来看几个例子,假设你正在构建一个人脸识别应用,出于某种原因,你希望算法可以给出眼角的具体位置,眼角坐标为(x,y),你可以让神经网络的最后一层,多出两个数字lx和ly,作为眼角的坐标值.

如果你想知道两只眼睛的4个眼角的具体位置,那么从左到右依次用4个特征点来表示这4个眼角,对神经网络稍微做些修改,输出第1个特征点(l1X,lxy),第2个特征点(l2x,l2y)依次类推。这4个脸部特征点的位置就可以通过神经网络输出了,也许除了这4个特征点,你还想得到更多的特征点输出值,这些都是眼睛的特征点,你还可以根据嘴部的关键点输出值,来确定嘴的形状,从而判断人物是在微笑,还是在皱眉。也可以提取鼻子周围的关键特征点,为了便于说明,你可以设定特征点的个数。

假设脸部有64个特征点,有些点甚至可以帮助你定义脸部轮廓甚至下颌轮廓。

选定特征点个数,并生成包含这些特征点的标签训练集,然后利用神经网络输出脸部关键特征点的位置。

具体做法是准备一个卷积网络和一些特征集,将人脸图片输入卷积网络,输出1或0,1表示有人脸,0表示没有人脸,然后输出(lx1,ly1)…直到(l64x,l64Y),这里用L代表一个特征,有129个输出单元,其中1表示有人脸,因为有64个特征,64×2,所以最终输出128加一个单元,由此实现对图片的人脸检测和定位.

如果你玩过Snapchat或其他娱乐类应用,你应该对AR(增强现实)过滤器多少有点了解,Snapchat过滤器实现了在脸上画皇冠,和其他一些特殊效果。检测脸部特征也是计算机图形效果的一个关键构造模块,比如实现脸部扭曲,可头带皇冠等等。

为了构建这样的网络,你需要准备一个标签训练集,也就是图片X和标签Y的集合,这些特点点都是人为辛苦标注的。

最后一个例子,如果你对人体姿态检测感兴趣,你还可以定义一些关键特征点,比如胸部的中点,左肩,左肘,腰等等。,然后通过神经网络标志人物姿态的关键特征点,在输出这些标注过的特征点,就相当于输出了人物的姿态动作。要实现这个功能,需要设定这些关键特征点,从胸部中心点(l1x,l1y)一直往下,直到(l32x,l32y)。

一旦了解如何用二维坐标系定义人物姿态,操作起来就相当简单了。批量添加输出单元,用于输出加识别的各个特征点的(X,Y)坐标值,要明确一点,特征点1的特性在所有图片中必须保持一致,标签在所有图片中必须保持一致。假如你雇用他人或自己标记了一个足够大的数据集,那么神经网络便可以输出上述所有特征点,你可以利用他们来实现其他有趣的效果,比如判断人物的动作姿态,识别图片中的人物表情等等。

B站视频来源:【中英字幕】吴恩达深度学习课程第四课 — 卷积神经网络_哔哩哔哩_bilibili

吴恩达卷积神经网络学习笔记(六)|CSDN创作打卡相关推荐

  1. 吴恩达 - 卷积神经网络 学习笔记(一)

    转载来源:http://www.cnblogs.com/marsggbo/p/8166487.html DeepLearning.ai学习笔记(四)卷积神经网络 – week1 卷积神经网络基础知识介 ...

  2. 吴恩达 卷积神经网络原理图

    吴恩达 卷积神经网络原理图

  3. 吴恩达机器学习视频学习笔记

    吴恩达机器学习视频笔记 介绍 Introduction 线性回归 Linear Regression 单变量 One Variable 多变量 Multiple Variables 多项式回归 Pol ...

  4. 吴恩达卷积神经网络 笔记,吴恩达 深度神经网络

    如何评价吴恩达的学术地位 吴恩达(AndrewNg),斯坦福计算机系的副教授,师从机器学习的大师级人物MichaelI.Jordan. 同门师兄弟包括ZoubinGhahramani,TommiJaa ...

  5. 吴恩达卷积神经网络笔记,吴恩达人工智能公开课

    吴恩达是个谁 吴恩达(1976-,英文名:AndrewNg),华裔美国人,是斯坦福大学计算机科学系和电子工程系副教授,人工智能实验室主任.吴恩达是人工智能和机器学习领域国际上最权威的学者之一. 吴恩达 ...

  6. 吴恩达机器学习 -- 神经网络学习

    9.1 非线性假设 无论是线性回归还是逻辑回归都有这样一个缺点,即:当特征太多时,计算的负荷会非常大. 吴恩达老师举了一个例子: 当我们使用 的多次项式进行预测时,我们可以应用的很好. 之前课程学习过 ...

  7. 吴恩达推荐深度学习笔记+超详细思维导图!不做学术打工人!

    关于人工智能的分支-深度学习版块的资源有很多,但是都会较为分散.小编今天对这些资源进行了整理归纳,汇编了一套学习资源(包含书籍+电子书+百篇论文+思维导图+吴恩达深度学习笔记大全+计算机视觉学术汇总) ...

  8. 吴恩达卷积神经网络课程——第一周笔记

    Week 1 目录 Week 1 1-1.计算机视觉 1-2.边缘检测示例 1-3.更多关于边缘检测内容 1-4.Padding 1-5.卷积步长 1-6.卷积为何有效 1-7.单层卷积网络 1-8. ...

  9. 【吴恩达机器学习】学习笔记——2.1单变量线性回归算法

    1 回顾 1.1 监督学习 定义:给定正确答案的机器学习算法 分类: (1)回归算法:预测连续值的输出,如房价的预测 (2)分类算法:离散值的输出,如判断患病是否为某种癌症 1.2 非监督学习 定义: ...

最新文章

  1. ASP.NET结合COM组件发送Email
  2. 不学无数——SpringBoot入门Ⅱ
  3. 可打开可关闭的选项卡,单纯无污染,改改样式就能用
  4. “千年虫”,计算机的巨大BUG!
  5. appconfig文件中的配置节
  6. 成为高级网络管理员必学知识
  7. TRUNCATE TABLE恢复-脚本
  8. c语言ax2bxc0,c语言程序用函数怎么输出ax2bxc=0?用C语言编号一个程序, 爱问知识人...
  9. 使用Mondrian Virtual OLAP Cube 实现星座模型并在saiku展现分析
  10. cvFloodFill() 漫水填充算法
  11. CIC滤波器设计原理总结
  12. Java代理模式及其应用
  13. 【观察】UCloud:决胜东南亚“正当时”,做出海企业“加速器”
  14. 模块手机Project Ara的MDK(Module Developers Kit)模块开发套件
  15. 微信小程序药店管理系统+后台管理系统|前后分离VUE
  16. 第一章 老虎Linux简介
  17. 前端下载其他服务器上的跨域图片资源问题
  18. 软件项目经理需要了解的法律法规
  19. 一道输出超限nnnn次的题
  20. 基于motion视频捕捉软件的树莓派视频拍照系统(图像变化识别+拍照+邮件)

热门文章

  1. EAN13条形码了解,有c测试代码
  2. Xposed去除抖音Toast教程
  3. 嵌入式知识-ARM裸机-学习笔记(9):SD卡启动详解(S5PV210)
  4. HBase进化之从NoSQL到NewSQL,凤凰涅槃成就Phoenix 1
  5. 微信开放平台第三方平台授权小程序权限集id对应中文说明
  6. 洛谷刷题C语言:闰年判断、Apples、洛谷团队系统、肥胖问题、三位数排序
  7. 「斐讯」N1-YYF 固件
  8. 基于树莓派+STM32+OneNET云平台打造智能家居系统(一)硬件设计篇
  9. 巴菲特:我可以发2100万个巴菲特币|附视频
  10. 仿京东淘宝商品详情页中视频和图片的轮播功能