论文:https://arxiv.org/pdf/1712.02822.pdf

作者及团队:Alex Levinshtein & Edmund Phung & Parham Aarabi 加拿大多伦多大学

会议及时间:2017

Code:

Abstract

1. 作者想解决什么问题?

eye center localization

2. 作者通过什么理论/模型来解决这个问题?

提出一种新的级联回归器进行眼中心检测。使用现有的面部特征对齐方法可以更准确地检测眼睛,通过使用advanced features 和powerful regression machinery来提高算法定位的鲁棒性,添加圆拟合后处理步骤来使定位更加准确。 最后,使用一种简单的手工方法进行眼中心定位,展示了如何在无需人工注释训练数据的情况下训练级联回归器。

3. 作者给出的答案是什么?

在数据集BioID, GI4E, 和TalkingFace 上测试,在平均归一化误差e <0:05时,经过人工注释的数据训练的回归变量的准确度为95:07%(BioID),99:27%(GI4E)和95:68%(TalkingFace);自动训练的回归器几乎一样好,准确性为93:9%(BioID),99:27%(GI4E)和95:46%(TalkingFace)。

1.Introduction

1.1. 作者为什么研究这个课题?

野外的眼中心定位对于很多应用都很重要,比如eye tracking, iris recognition,以及增强现实应用。虽然有些技术需要使用专门的头戴装置或主动照明,但这种设备价格昂贵,在许多情况下不适用。所以作者提出使用标准相机进行eye center localization.

1.2. 目前这个课题的研究进行到了哪一阶段?

eye center localization的方法可以分为两类。
第一类手动拟合方法(hand-crafted model fitting) 。这些技术使用的外观,如瞳孔的黑暗,和瞳孔和虹膜的圆形形状来检测。这些方法通常是准确的,但往往缺乏鲁棒性,在更有挑战性的环境,如低分辨率或噪声图像和低照明。

第二类是基于机器学习的方法。其中有基于训练滑动窗口眼睛中心探测器的方法和基于面部特征对齐的级联回归方法进行眼睛中心定位。虽然这类方法已经被证明是更健壮的,但是它们缺乏模型拟合方法的准确性,并且需要注释的训练数据

1.4. 作者使用理论基于哪些假设?

在有关面部特征对齐的文献中,有两种类型的级联回归方法:使用复杂特征(例如SIFT或HoG)的简单级联线性回归器和使用简单成对像素差异特征的更复杂级联回归森林。

contribution1: 提出了采用了复杂的特征和复杂的回归器的眼中心定位新方法。该方法基于级联回归树,每个级联的特征都锚定到当前的眼中心估计,并且采用了更强大的梯度直方图功能(基于Dollar等人的行人检测工作[8]),而不是简单的成对像素差异。 最后,利用准确的眼睛轮廓来初始化回归器并归一化特征位置。

contribution2: 通过添加圆拟合后处理步骤来优化回归估计。 采用可靠的估计和虹膜大小的先验知识有助于子像素精度眼中心检测, 从而实现了亚像素精度的眼中心定位。(所提出的级联回归方法是健壮的,但是具有其他基于判别性回归的方法的相同缺点。 即,它是不准确的,并且需要带注释的训练数据)。

contribution3: 通过使用手工制作的眼中心检测器,无需手动注释的训练数据即可对回归进行训练。

2.method:研究方法:数据来源+重要指标+模型步骤+每个步骤得出的结论

2.1. 模型分哪几步?每一步分别得出了什么结论?

2.1.1.Eye Center Localization
2.1.2.Cascaded regression framework

2.1.3.Iris refinement by robust circle fitting

2.1.4.Using a hand-crafted detector for automatic annotations
2.1.5.Handling closed eyes

2.2. 研究的数据从哪里来?

2.3. 研究中用到的重要指标有哪些?

2.4. 实验结果

3.Conclusion

3.1. 这篇文章存在哪些缺陷?

3.2. 作者关于这个课题的构思有哪几点?

Hybrid eye center localization using cascaded regression and hand-crafted model fitting相关推荐

  1. 《Accurate eye center localisation by means of gradients》论文阅读

    题目:Accurate eye center localisation by means of gradients 作者:Fabian Timm and Erhardt Barth 来源:Publis ...

  2. 新加坡国立计算机视觉博士常,黄科杰的个人主页-Zhejiang University Personal homepage...

    Journal 2021 J31 Jiahui Kong, Haibin Shen, Kejie Huang, "DualPathGAN: Facial reenacted emotion ...

  3. 人脸对齐--Face Alignment by Explicit Shape Regression

    Face Alignment by Explicit Shape Regression CVPR2012 https://github.com/soundsilence/FaceAlignment 本 ...

  4. 巩膜:论文翻译《一种改进的眼角检测算法》An Improved Algorithm for Eye Corner Detection

    1509.04887.pdf论文翻译 An Improved Algorithm for Eye Corner Detection Anirban Dasgupta, Anshit Mandloi, ...

  5. SLAM综述阅读笔记二:Simultaneous Localization and Mapping: A Survey of Current Trends in Autonomous(2017)

    转自[第八篇 SLAM:自动驾驶当前趋势综述 - 知乎] 说明该总结主要是针对自动驾驶 <Simultaneous Localization And Mapping: A Survey of C ...

  6. 一、Linear Regression

    本文转自http://zhfuzh.blog.163.com/blog/static/14553938720127309539465/,所有确立归原作者所有. 先定义好我们所使用的符号语言,大写的表示 ...

  7. 人脸3D重建:Cascaded Regressor

    <Cascaded Regressor based 3D Face Reconstruction from a Single Arbitrary View Image>论文解读 本文来自四 ...

  8. 【论文笔记】2019 基于激光点云pole检测的重定位方法 Long-Term Urban Vehicle Localization Using Pole Landmarks

    https://github.com/acschaefer/polex 本文提出了一个基于激光三维点云的二维车辆定位系统,其根据道路场景中的 "pole landmarks" (极 ...

  9. Logistic Regression 逻辑回归数学原理、python代码实现、实际应用

    说在前面 第一次写博客,主要目的是再梳理一下学到东西的逻辑,如果可以帮助到其他在学习的人就更好啦.本篇主要参考的:<机器学习>西瓜书.博主文章:文章链接.以及知乎.百度等大神们的解惑文章 ...

最新文章

  1. hitchhiker部署_Hitchhiker的React Router v4指南:无限远的递归路径!
  2. 数据结构实验之二叉树七:叶子问题
  3. ubuntu卸载nvidia驱动_解决Ubuntu18.04循环登录问题 - 卸载NVIDIA驱动 启用Nouveau(1)
  4. 云信小课堂丨视频“双录”知多少?
  5. 《零基础》MySQL 安装(二)
  6. 看完这篇你们团队的代码也很规范
  7. 利用文本文档运行java程序_Java上机练习
  8. java.io 相关tips
  9. 【前端】【cornerstone】cornerstone.js如何编辑图像/加载已有图像数据(以画直线为例)
  10. 彻底搞清 Flink 中的 Window 机制
  11. pandas 字符串切片后保存_我擦~字符串转字节切片后,切片的容量竟然千奇百怪...
  12. [转载] java调用c++的dll及java.lang.UnsatisfiedLinkError解决方法
  13. 操作系统原理(三)进程管理、线程、并发和并行
  14. python爬虫气象数据_python爬虫入门,获取全国气象站24小时整点气象数据(二)...
  15. 数组输出c语言程序,C语言输出数组的三种方法
  16. dynamic k-max pooling 动态k-max 池化
  17. 拜登签署芯片法案后,英特尔股票的前景如何?
  18. New Phy: 中科院城环所朱永官等综述全球变化对叶际微生物组的影响
  19. 【图像分割】基于计算机视觉实现视网膜图像中的血管分割附matlab代码
  20. xposed模块编写教程_Xposed插件开发入门详解

热门文章

  1. Spatial-Spectral Transformer for Hyperspectral Image Classification_外文翻译
  2. Python 爬虫自动访问点击刷CSDN博客文章阅读量
  3. 全国高考今日开启 报名人数再创历史新高 2022全国高考时间科目安排 优积科技-祝同学们高考顺利
  4. 在office中插入特殊符号方框带√
  5. (17)UVM sequencer和driver
  6. 谨以此辞职信祭奠我的第一份工作
  7. bat批处理与adb命令的配合
  8. 一种点到特定高维平面的距离的优化算法
  9. Windows10 Hyper-v 虚拟机安装点心云,实现闲置宽带共享。
  10. RN综合演练,仿美团电商(谢谢你的STAR)