来源:Coursera吴恩达深度学习课程

目标定位(Object localization)中介绍了其中一种思路,这里介绍另一种思路。神经网络也可以通过输出图片上特征点(landmark)的(x,y)坐标来实现对目标特征的识别,下面看几个例子。

假设你正在构建一个人脸识别应用(face recognition application),你希望算法可以给出眼角的具体位置。眼角坐标为(x,y),让神经网络的最后一层多输出两个数字l_x和l_y,最为眼角的坐标值。如果你想知道两只眼睛的四个眼角的具体位置,那么依次用四个特征点来表示从左到右的四个眼角,例如第一个特征点(l_1x,l_1y),第二个特征点(l_2x,l_2y)等。

同样你也可以根据嘴部的关键点输出值来确定嘴的形状,也可以提取鼻子周围得到关键特征点。假设脸部有64个特征点(landmarks),有些点甚至可以定义脸部轮廓(define the edge of the face)或下颌轮廓(define the jawline)。选定特征点个数,并生成包含这些特征点的标签训练集(label training set),然后利用神经网络输出脸部关键特征点的位置

具体做法是,准备一个卷积网络和一些特征集,将人脸图片输入卷积网络,输出1或0,1表示有人脸,0表示没有人脸,然后输出(l_1x,l_1y)......直到(l_64x,l_64y)。这里一共有129(1+2*64=129)个输出单元,由此实现对图片的人脸检测和定位。这只是一个识别脸部表情的基本构造模块(basic building block),如果你玩过Snapchat或其它娱乐类应用(other entertainment),你应该对AR(增强现实Augmented Reality)过滤器多少有些了解,Snapchat过滤器实现了在脸上画皇冠和其他一些特殊效果。

再看一个例子,上图的第三张图,如果你对人体姿态检测(people post-detection)感兴趣,也可以定义一些关键特征点(key positions),如胸部的中点(the midpoint of the chest),左肩(the left shoulder),左肘(left elbow),腰(the wrist)等,从胸部中心点(l_1x,l_1y)一直向下,一直到(l_32x,l_32y)。然后通过神经网络标注人物姿态的关键特征点,再输出这些标注过的特征点,就相当于输出了人物的姿态动作。一旦了解如何用二维坐标系(two coordinates)定义人物姿态,操作起来就相当简单了。要明确一点,特征点的特性(identity)在所有图片中必须保持一致,就好比,特征点1始终是右眼的外眼角,特征点2是右眼的内眼角,特征点3是左眼内眼角,特征点4是左眼外眼角等等。同样可以利用特征点实现其他有趣的效果,比如判断人物的动作姿态(estimate the pose of a person),识别图片中的人物表情(recognize someone’s emotion from  a picture)等等。

以上就是特征点检测(landmark detection)的内容,熟悉这些构造模块有利于构建目标检测算法。

说明:记录学习笔记,如果错误欢迎指正!转载请联系我。

特征点检测(Landmark detection)相关推荐

  1. 【吴恩达deeplearning.ai】3.2 特征点检测

    ←上一篇 ↓↑ 下一篇→ 3.1 目标定位 回到目录 3.3 目标检测 目标点检测 (Landmark Detection) 上节课,我们讲了如何利用神经网络进行对象定位,即通过输出四个参数值 bx. ...

  2. Facial Landmark Detection(人脸特征点检测)

    原文地址:http://www.learnopencv.com/facial-landmark-detection/#comment-2471797375 作为计算机视觉研究员,我们很早就开始研究人脸 ...

  3. learnOpenCv】Facial Landmark Detection:人脸特征点检测的一些应用

    目前在计算机视觉领域,人脸方向的研究非常之多.人脸分析最常见的应用是人脸识别,但是如果我们想要验证图像中一个人的身份,需要先知道这个图像中人脸的位置.因此,人脸检测(在图像中定位人脸,并返回一个包含人 ...

  4. Multiple Landmark Detection using Multi-AgentReinforcement Learning基于多智能体强化学习的多重地标检测

    目录 摘要 介绍 贡献 相关工作 方法 协作代理 实验 数据集 训练 测试 讨论 计算性能 结论 References 摘要 解剖标志的检测是医学图像分析和诊断.解释和指导应用的重要步骤. 对地标进行 ...

  5. 特征点检测:CenSurE: Center Surround Extremas for Realtime Feature Detection and Matching

    特征点检测:CenSurE: Center Surround Extremas for Realtime Feature Detection and Matching 1. CenSurE 特征 1. ...

  6. ShapeNet:超实时人脸特征点检测与形状拟合开源库

    点击我爱计算机视觉标星,更快获取CVML新技术 近日,来自德国亚琛工业大学的研究人员开源了形状拟合库ShapeNet,其可以实现超实时的人脸特征点检测,也可以用在其他任何需要形状拟合的应用场景. 开源 ...

  7. 人脸关键点:TCDCN-Facial Landmark Detection by Deep Multi-task Learning

    <Facial Landmark Detection by Deep Multi-task Learning>发表于ECCV-2014,作者来自香港中文大学汤晓鸥团队的Zhanpeng Z ...

  8. Facemark:使用OpenCV进行面部特征点检测

    面部特征检测应用很多,我将在下一节介绍当前项目用到一个典型例子,因为疲劳检测有一张方案是通过检测人眼的闭合时间来实现的,在实际装车应用中效果还不错.本节先介绍一下opencv中自带的特征点检测功能,后 ...

  9. Translation[VERTEBRA-FOCUSED LANDMARK DETECTION FOR SCOLIOSIS ASSESSMENT]——2021.6.18

    VERTEBRA-FOCUSED LANDMARK DETECTION FOR SCOLIOSIS ASSESSMENT 摘要 1. INTRODUCTION 2. METHOD 2.1. Heatm ...

  10. 【论文阅读】Misshapen Pelvis Landmark Detection WithLocal-Global Feature Learning for DiagnosingDevelop

    作者及团队:刘川斌 Chuanbin Liu; 谢洪涛; 张思成; 毛振东; 孙俊; 张永东 会议及时间:IEEE Transactions on Medical Imaging 2020-12| 期 ...

最新文章

  1. 下面属于java的object_在JAVA中,下列哪些是Object类的方法()
  2. 中国数学家在微分几何学领域取得重大突破
  3. java I/O思维导图
  4. SpringMVC注解@RequestParam全面解析
  5. 机器学习算法(优化)之一:梯度下降算法、随机梯度下降(应用于线性回归、Logistic回归等等)...
  6. 【直播回放】60分钟剖析GAN如何用于人脸的各种算法
  7. Freebsd10.3(FreeBSD11 Beta1)使用手记
  8. 你所不知到的C++ 系列
  9. 配置MYSQL远程连接
  10. Android之AIDL使用详解
  11. c语言解析分隔符文本,c – 使用分隔符读取文件
  12. iBatis 事务控制 与 两表操作将SQL语句写入单表
  13. 3蛋白wb_老司机手把手教你选WB内参
  14. Debian的软件包管理工具命令不完全列表
  15. 价值98元的千神资源网模板
  16. linux on win原理,linux on win10 上手体验
  17. CentOS TinyProxy http(s)上网代理及置代理上网的方法
  18. cursor图标自定义
  19. 计算机科学与技术专业考研方向有哪些,计算机科学与技术专业考研方向有哪些?...
  20. mysql视图默认校对规则_MySQL 校对规则

热门文章

  1. 如何在CSDN上上传资源
  2. 如何从Mixamo下载人物模型的动画
  3. 2018秋季学习总结
  4. PhotoShop基础入门
  5. phalcon mysql_Phalcon 数据库操作总结
  6. 【JS】V8 引擎原理
  7. 密度分析(七) Python实现
  8. Gazebo物理仿真环境搭建 实例
  9. 正睿高性能计算服务器,强CPU 20倍!正睿Tesla GPU计算系统评测
  10. numpy.linalg 中的逆矩阵 inv