论文信息:
硕士论文-网络新闻图像中人脸标注技术的研究-2011-哈尔滨工业大学-刘胜宇
文末附人脸标注相关论文下载地址

文章目录

  • 摘要
  • 技术
  • 数据集
  • 实验结果
  • 结论
  • 参考文献(部分)
    • 关于图像标注
    • 关于聚类
    • 关于跨媒体
  • 资源(对应技术中的标号)

摘要

针对网络新闻数据图文互补特性,提出基于改进AP聚类的人脸图像标注方法,以及标注后的一人多名问题的处理方法。相对于k-means与AP聚类算法,改进的AP聚类算法能够更加充分利用网络新闻数据图文互补的特性,得到更好的聚类结果,从而得到更准确的人脸标注。

本文最终得到一个带有人名标注的人脸图像数据库,同时支持基于内容与基于文本的人物检索。

技术

  • 人脸检测算法:Adaboost[1]。 (论文page-10)
    人脸检测问题实际上就是一个两类分类问题, 即对一个待判别的图像区域,分类器需要给出其是否是人脸区域
    Viola 等人提出的基于Adaboost的人脸检测算法可以进行实时人脸检测,并且有较好的检测结果。此方法采用“积分图像”来表示人图像,利用积分图像表示方法表示的图像可以快速地提取特征。同时该方法将由简单特征得到的弱分类器进行融合得到强分类器,并将强分类器进行级联得到了层叠分类器。将分类速度比较快的分类器放在层叠分类器的前端, 可以快速排除非人脸区域,大大减少了需要进行判别的图像数量,使人脸检测的响应速度得到提高。 在 Viola 人脸检测方法中,AdaBoost算法将从巨大的特征集合中挑选出最有代表性的若干特征,每个被挑选出的特征对应一个弱分类器。最后将这些弱分类器进行融合得到强分类器。
  • 人脸图像预处理。包括人脸图像灰度归一化和几何归一化。人脸图像预处理主要是为了消除图像尺寸、光照变化情况以及图像平面内的平移与旋转对人脸图像造成的影响。
    • 灰度归一化。包括滤波去噪、图像增强(方法如直方图均衡化)、图像均值方差归一化等。
    • 几何归一化。包括人眼定位。
  • 人脸特征提取。
    • 主成分分析(Principal component Analysis, PCA)[2]。
    • 图像相似度度量。(如欧式距离(本文采用)、曼哈顿距离、明氏距离)
  • 聚类算法
    • 层次聚类[3]。
    • 划分聚类。如k-means 聚类[4]。
    • AP聚类[5]。Frey等人在2007年提出了AP(affinity propagation)聚类算法。AP聚类算法,又称为近邻传播聚类算法,该算法利用样本点的近邻信息找到样本集合中 最优的类代表点集合,使所有样本点与其所属类别的类代表点的相似度最大。 AP 聚类算法与 k-means 聚类算法的聚类准则函数是一致的, 但是聚类原理不 同。 AP 算法将所有样本点都当作候选的类代表点,通过近邻信息的传播找到 最优的类代表点集合, 并且 AP 聚类算法的类代表点都是样本集中实际的数据点。在选择初始聚类中心时,k-means随机选择若干个样本点作为初始的聚类中心,导致聚类结果受初始聚类中心选择的影响很大,AP聚类算法则是将所有的样本点都看作候选的类代表点,聚类结果不受初始聚类中心选择的影响。
    • 改进的AP聚类算法。page-36.

数据集

本文处理的数据是Tamara L.Berg个人主页上提供的实验数据集。该数据集来源于雅虎新闻网上将近两年的新闻数据,包含 28204条新闻。
本文通过人脸检测 理,从每幅图像中可以得到若干幅标准化的人脸图像,且人脸图像被归一化到 相同大小86×86。通过处理,从每条新闻中可以得到一个人脸集合与一个人名 集合, 最终 得到 28204 个人脸图像集合与对应的 28204 个人名集合。 分别包含 30281幅人脸图像与14108个人名

实验结果


对各聚类标注后,可能存在标注有不同人名的聚类实际上对应同一个人。 可以通过计算聚类间相似度将对应着同一个人的不同聚类合并,进而识别出同 一个人的不同人名。 实验结果表明,对于聚类成员个数大于 10的310 个聚类进 行合并,被正确合并的聚类可达 84%。

结论

本论文完成了如下几个方面的研究工作:

1、针对网络新闻中的人脸图像标注这样一个 特别的图像标注问题 ,提出 了解决此问题的方法框架。
2 、 实现了 基于 Adaboost 算法的人脸检测方法。 由于检测得到的人脸图像 来源于网络,图像比较复杂,针对复杂的人脸图像,对人脸图像进行了归一化 处理,主要工作有滤波去噪、人脸图像增强、人眼定位及人脸校正等。
3、采用“特征脸”方法提取人脸特征, 采用欧式距离作为人脸图像相似性的度量,通过基于聚类的图像标注算法对人脸图像进行标注。
本文将改进的 AP 聚类算法应用到人脸图像标注中,对大规模的人脸图像 数据库进行标注,得到一个带有准确人名标注的人脸图像数据库,同时支持基 于内容与基于文本的人物检索。在此数据库中就可以快速地进行人物检索。

参考文献(部分)

关于图像标注

[10] A. Makadia, V. Pavlovic, S. Kumar. A new baseline for image annotation[C].
Proceedings of the 10th European Conference on Computer Vision,2008:316329.
[11] J. Jeon, V. Lavrenko, R. Oka. Automatic Image Annotation and Retrieval Using Cross-media Relevance Models[C]. Proc. of SIGIR, 2003.
[12] D.M. Blei, M. I. Jordan. Modeling annotated data[C]. Proc. of SIGIR, 2003.
[13] Chong Wang, David Blei, LiFei-Fei. Simultaneous Image Classification and Annotation[C]. CVPR, 2009.
[15] J. Liu, M. Li, Q. Liu, H. Lu,S. Ma. Image annotation via graph learning[J].
Pattern Recognition, 2009, 42:218-228.
[16] C. Wang , F. Jing, L. Zhang , H.J. Zhang. Scalable search-based image annotation of personal images[C]. Proceedings of the 8th ACM international workshop on Multimedia information retrieval, 2006:69-278.
[17] X. Wang,L. Zhang,F. Jing, W. Ma. AnnoSearch: Image Auto-Annotation by Search[C]. Proceedings of the 2006 IEEE Computer Soeiety Conference on Computer Vision an Pattern Recognition, 2006:1483-1490.
[18] Rui Xiaoguang, Li Mingjing , Li Zhiwei , Ma Wei-Ying , Nenghai Yu. BiPartite Graph Reinforcement Model for Web Image Annotation[C]. Proceedings of the 15th annual ACM international conference on Multimedia,2007.

关于聚类

[19] SHRIVASTAVA R, UPADHYAY K, BHATI R etal. Comparison between KMean and C-Mean Clustering for CBIR[C]. Proceedings of the 2010 Second International Conference on Computational Intelligence, Modeling and Simulation, 2010:117-118.
[34] T. Zhang, R. Ramakrishnan, M. Livny. Birch: an efficient data clustering method for very large databases[C]. Proceedings of the ACM SIGMOD Conference on Management of Data, 1996:103-114.
[35] S. Guha, R. Rastogi, K. Shim. CURE: a clustering algorithm for large databases[C]. Proceedings of the ACM SIGMOD Conference on Management of Data, 1998:73-84.
[36] S. Guha,R. Rastogi,K. Shim. ROCK: a robust clustering algorithm for categorical attributes[C]. Pro ceedings of the 15st International Conference on Data Engineering, 1999:23-26.

[37] G. Karypis, E. Han, V. Kumar. Chame leon: hierarchical clustering using dynamic modeling[J]. IEEE Computer 1999,32:68-74.

[38] L. Kaufman, P. J. Rousseeuw. Finding Groups in Data: An Introduction to Cluster Analysis. 1990.
[41] FREY B, DUECK D. Clustering by passing messages between data points[J].
Science, 2007, 315(5814):972-976.
[43] 肖宇 , 于剑 . 基于近邻传播算法的半监督聚类 [J]. 软件学报 , 2008, 19(11):2803-2813

关于跨媒体

[14] J. Y. Pan, H. J. Yang, D. Pinar. Automatic multimedia cross-modal correlation discovery[C]. The Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2004:653-658.

资源(对应技术中的标号)

【1】Adaboost算法原理和python代码实现
【2】主成分分析原理和python代码实现https://blog.csdn.net/program_developer/article/details/80632779
【3】层次聚类和python代码实现
【4】K-MEANS 算法(cool shell)
聚类分析原理和相关参数
【5】AP聚类和python代码
AP聚类论文翻译和matlab实现
AP聚类原理

其它人脸标注论文下载

论文笔记--网络新闻图像中人脸标注技术的研究-2011相关推荐

  1. 读《环境光遮蔽技术在图形图像中若干关键技术的研究》总结-其一

    末尾附文章引用 文章架构: 开篇先写Abstract,对本文章的研究内容进行了总结性概述: Abstract怎么写? 1.点名研究内容,研究意义,提出当下需要解决的问题. 2.讲本文章解决这些问题的思 ...

  2. matlab截视频人脸,一种视频图像中人脸图像截取方法与流程

    本发明涉及人工智能领域,具体涉及一种提高人脸比对性能的视频图像中人脸图片截取方法. 背景技术: 人脸图像比对需要对人脸图像提取特征数据,用于人脸对比的人脸特征提取,主要是对经人脸检测过程截取到的视频图 ...

  3. 门禁系统中人脸检测技术的原理剖析和使用教程

    引言 人脸检测 API 是一种基于深度学习技术的图像处理API,可以快速地检测出一张图片中的人脸,并返回人脸的位置和关键点坐标,在人脸识别系统.人脸情绪识别等多种场景下都有极大的应用. 本文将从人脸检 ...

  4. 谷歌最新论文:从图像中进行3-D目标检测

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 作者:黄浴 知乎链接:https://zhuanlan.zhihu.com/p/1 ...

  5. 「ArXiv2020」【Efficient Transformers: A Survey】论文笔记(更新中)

    「ArXiv2020」[Efficient Transformers: A Survey]论文笔记 Abstract 1. Introduction 2. Background on Transfor ...

  6. 【学习笔记】OFDM中信道估计技术分析与实现

    目录 一.信道估计概念 二.信道估计作用 三.相干检测与非相干检测 (一)非相干检测 (二)相干检测 (三)注意 四.影响信道估计算法性能的重要因素 五.信道估计方法的划分 (一)根据处理域的不同, ...

  7. 论文笔记--跨媒体语义共享子空间学习理论与方法研究-2015

    论文信息: 博士论文-跨媒体语义共享子空间学习理论与方法研究-2015-北京交通大学-张磊 文末部分参考文献附有论文下载链接,包括与本论文相关的论文下载地址 论文标题:跨媒体语义共享子空间学习理论与方 ...

  8. 94页论文综述卷积神经网络:从基础技术到研究前景

    点击上方"Datawhale",选择"星标"公众号 第一时间获取价值内容 选自arXiv 机器之心编译 参与:Panda 卷积神经网络(CNN)在计算机视觉领域 ...

  9. 基于深度学习的图像超分辨率重建技术的研究

    1 超分辨率重建技术的研究背景与意义 图像分辨率是一组用于评估图像中蕴含细节信息丰富程度的性能参数,包括时间分辨率.空间分辨率及色阶分辨率等,体现了成像系统实际所能反映物体细节信息的能力.相较于低分辨 ...

最新文章

  1. Java基础入门语法和安装
  2. Java 理论与实践: 非阻塞算法简介——看吧,没有锁定!(转载)
  3. python编程可视化小程序_人人都可以写的可视化Python小程序第二篇:旋转的烟花...
  4. 漫 谈oracle 中 的 空 值
  5. 使用动态代理,提高工作效率
  6. python字典文件,python-文件转字典,字典转文件
  7. python打开伪终端_0xB:伪终端
  8. Linux故障自愈脚本,实现故障自愈要攻克的3个问题以及开箱即用的方案
  9. 使用xlsx.core.min.js进行导入(表格)导出(Excel)功能
  10. 剖析Linux的守护神
  11. 【Appium】使用W3C actions方法长按元素
  12. Redis批量删除Key的三种方式(linux和windows环境下都有)
  13. linux压缩比例最大工具bzip2
  14. Android 商品详情中规格的联动选择实现
  15. Android屏幕截屏(全屏bitmap)
  16. 读《乔布斯传记》有感4-----回到苹果
  17. VS2008编译使用boost
  18. 2020新版siteground主机空间服务器购买选择图文教程-跨境电商外贸网站最佳主机空间
  19. 软件测试-软件的生命周期Xmind图
  20. MyBatis框架知识点大全,从0到1(配置文件和使用、手动和全自动映射、lombok使用、Mybatis测试工具类、动态SQL、通过注解来实现动态SQL和手动一对一、一对多、多对多映射)

热门文章

  1. 电脑开机进不了桌面拒绝访问怎么办
  2. 统一返回码,返回结果实体类
  3. maven分模块构建项目工程
  4. docker 离线安装_企业级Docker私库Harbor安装详解
  5. Car-like Robot运动模型及应用分析
  6. c语言编写界面图形表示,「分享」C语言如何编写图形界面
  7. c语言3到7位水仙花数流程图_C语言入门基础整理
  8. WCF(四) 绑定
  9. Word 2003中对不同的节设置不同的页面边框的特殊情况小结
  10. pymol安装教程linux,PyMOL | Pymol绘图教程(一)