论文信息:
硕士论文-跨模态间的人脸与人名对齐方法研究-2012-复旦大学-吴伟
文末附人脸标注论文下载地址

文章目录

  • 摘要
  • 技术
    • 框架图
    • 人名重要性评估
      • 人名检测
      • 句法分析获得人名重要性&语义细化
    • 人脸检测&人脸特征表示
    • 人脸内聚度度量
    • 自制网络爬虫
    • 自适应模拟退火遗传算法
  • 数据集
    • 介绍
  • 实验结果
    • 四组评估模式
    • 结果(整体数据集)
    • 将改进的自适应模拟退火遗传算法(ISSAGA)与标准遗传算法(GA)对比实验结果
  • 结论--page-53
  • 参考文献
    • 图像(跨媒体)检索
    • 人脸标注
  • 资源

摘要

本文提出了一种有效的自动人脸一人名对齐框架,能够更有效和更精确的 支持跨媒体新闻检索。
本文将人名重要性评估(NSR)、人脸~人名内聚度度量(NFCM)、基于Web的多模态信息挖掘以及改进的自适应的模拟退火遗传算法进行结合,共同构造成一种新颖的人脸一人名对齐框架,该框架能够有效的挖掘人脸和人名之间的内在关联性,进而提高跨媒体检索的性能。

技术

框架图

人名重要性评估

人名检测

  • 使用工具:stanfordNLP

句法分析获得人名重要性&语义细化

人脸检测&人脸特征表示

人脸内聚度度量

k近邻,相似度

自制网络爬虫

自适应模拟退火遗传算法

数据集

介绍

本文所使用的数据集是基于Berg等人构造的Labeled Yahoo!News Data,并且通过Guillaumin等人再次完善的大规模新闻数据集,这些新闻数据都是来源于雅虎新闻,每条新闻数据包含一张新闻图片以及相应的文本标注。
该数据集总共包括20071条图片一文本新闻数据,所有的这些新闻数据总共包括31147张人脸图片,而这些人脸图片属于5873个不同人。
Guillaumin等人对该数据集进行了完全标注,。过滤后的数据集则总共包含19389条图片一文本新闻数据,这些新闻数据总共包含28977张人脸图片和36106个人名。

实验结果

四组评估模式

(1)Baseline(NoTop+NFCM):对数据集进行基本的预处理过程,同时不对文本中的人名进行过滤筛选过程,也不对人脸进行内聚度评估方式下的人脸一人名对齐性能。

(2)Basetine(NFCM)+NSR(TOP
N):对数据集进行基本的预处理过程,在(1)中的Baseline模式下,新增人名重要性评估算法模块,并且配上人名过滤筛选TOP N操作。
(3)Baseline(NFCM)+NSR(TOP烈+1)):对于数据集进行基本的预处理过程,在Baseline模式下,新增人名重要性评估算法模块,并且配上人名过滤筛选TOP烈+1)操作。
(4)Baseline(NFCM)+NSR(TOP N)+WMIM:对于数据集进行基本的预处理过程,在Baseline模式下,新增人名重要性评估算法模块,并且配上人名 过滤筛选TOPN操作,同时在人脸一人名对齐过程之前,新增基于Web挖掘的多模态信息补充(WMIM)这一模块操作。

结果(整体数据集)

将改进的自适应模拟退火遗传算法(ISSAGA)与标准遗传算法(GA)对比实验结果

结论–page-53

本文同时文本和图像两种媒体介质,在当前已有的相关文本和图像处理技术基础之上,新增并完善了相关方法的实施,提出了一种较为新颖的整体框架用来对大规模的数据集进行自动的人脸一人名对齐过程,进而以达到大大提高新闻数据检索相关性的目的。
本文对当前公开的大规模数据集,进行了详细并多样化的数据实验。

本文对本为提出的人脸一人名对齐方法框架中的各个环节:人名重要性评估、基于Web的多模态信息发现、人脸集内聚度度量、改进的自适应模拟退火遗传算法,分别进行了充分的实验验证,也各自都得到了不错的实验结果。

参考文献

图像(跨媒体)检索

[1] R.Datta,D.Joshi,J.Li,and J.Z.Wang,“Image Retrieval:Ideas,Influences,and Age”,ACM Computing Surveys(csuR),v01.40,no.2,Article Trends ofthe New 5,2008.
[4]R.Yang and A.G.Hauptmanan,“A Review of Text Broadcast News and Image Retrieval Video”, Information Retrieval,v01.1 0,pp.Approaches for 445—484.2007.
[5]Y.T.Zhuang,Y Yang,and F.Wu,“Mining Semantic Correlation of Heterogeneous Multimedia Data for Cross—media Retrieval”,IEEE Transaction on Multimedia, v01.10,No.2,PP.221—229,2008.
[6]Y Yang,D.Xu,F.R Nie,J.B.LuG,and Alignment Y.T.Zhuang, for Cross Media with Local Retrieval”,Proc.MM 2009,PP. “Ranking Regression and Global 175—1 84,2009.

人脸标注

[8]RT.Pham,M.F.Moens,and T.Tuytelaars,“Cross—media Alignment of Names and Faces”,IEEE Transactions on Multimedia,v01.12,no.1,pp.13—27,2010.
[9]M.Guillaumin,T.Mensink,I.Verbeek,and C.Schmid,“Face Recognition from Caption-based Supervision” International Journal of Computer Vision, v01.96,no.1 PP.64—82,2012.
[10]B.Bozorgtabar and G.A.Rezai Rad.“A Genetic Programming—PCA Hybrid Face Recognition Algorithm”,Journal 2,PP.170—174,2011.
[12]D.D.Le and S.Satoh,“Unsupervised Face Annotation by Mining the Web”,Proc.ICDM2008,PP.383—392,2008.
[15]T.L.Berg,A.C.Berg,J.Edwards,M.Maire,R.White,Y W.The,E. Learned—Miller,and D.Forsyth,“Names and Faces in the News”,Proc.CVPR 2004,v01.2,PP.848—854,2004.
[23] Y.Su, S.Shan,X.Chert,and W.Gao,“Hierarchical and Local for Face Classifiers Recognition” IEEE Ensemble of Transaction on Global Image Processing,v01.18,no.8,PP.1885—1896,2009
[31]T.L.Berg,A.C.Berg,J.Edwards,and M.Maire,“Names and Faces”, Technical Report,U.C.at Berkeley,2007.
[33]M.Ouillaumin,T.Mensink,J.Verbeek,and C.Schmid,“Automatic Face Naming with Caption-based Supervision”,Proc.CVPR 2008,PP.1-8,2008.

资源

人脸标注论文

论文笔记--跨模态间的人脸与人名对齐方法研究-2012相关推荐

  1. 论文笔记--跨模态检索研究综述-2018

    论文信息: 期刊论文-跨媒体检索研究综述-2018-欧卫华 文末部分参考文献附有论文下载链接,并提供了本论文下载地址 转载本文请添加以下引用: 作者:lingpy 本文链接:https://blog. ...

  2. 跨交换机间单臂路由的实现方法

    跨交换机间单臂路由的实现方法 2007-06-11 17:13:37 标签:vlan 单臂路由 跨交换机 [推送到博客圈] 版权声明:原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 . ...

  3. 论文浅尝 | 基于知识图谱嵌入的 Bootstrapping 实体对齐方法

    来源: IJCAI 2018 链接: https://www.ijcai.org/proceedings/2018/0611.pdf 本文关注基于知识图谱嵌入(后文全部简称为知识嵌入)的实体对齐工作, ...

  4. 论文研读-文献聚类可视化-文献聚类结果可视分析方法研究

    文献聚类结果可视分析方法研究 1 论文概述 1.1 摘要 1.2 引言 1.3 脉络 2 可视分析框架 2.1 框架概述 2.2 框架组成 3 可视化设计 3.1 语料结构可视化 3.2 语料内容可视 ...

  5. 【项目调研+论文阅读】基于医学文献的实体抽取(NER)方法研究 day5

    一.<基于文献的药物表型实体识别及关系抽取方法研究>北京交通大学-张琛 表型实体:疾病.体症.基因.化学物质和药物名称. 信息提取的传统方法分为三步:命名实体识别.关系抽取.事件抽取. - ...

  6. 论文笔记:基于并行注意力 UNet的裂缝检测方法

    0 简介 论文:基于并行注意力 UNet的裂缝检测方法(Parallel Attention Based UNet for Crack Detection): 发表:2021年发表在<计算机研究 ...

  7. 论文阅读——基于文档主题结构的关键词抽取方法研究(理解)

    1.引言 1.1关键词自动标注的主要方式与算法 关键词自动标注主要有两种方式:关键词抽取与关键词分配. 关键词抽取,是从文档内容中寻找并推荐关键词 关键词分配,是从一个预先构造好的受控词表(contr ...

  8. 论文笔记--基于 FCM 聚类的跨模态人物图像标注方法-2015

    期刊论文-基于 FCM 聚类的跨模态人物图像标注方法-2015-微型电脑应用-赵昀,张翌翀 文末附人脸标注相关论文下载地址 文章目录 摘要 技术 人脸检测与特征表示(与2012年吴伟硕士论文<跨 ...

  9. CVPR论文 | 所见所想所找:基于生成模型的跨模态检索

    [小叽导读]:视觉-文本跨模态检索已经成为计算机视觉和自然语言处理领域结合的一个热点.对于跨模态检索而言,如何学到合适的特征表达非常关键.本文提出了一种基于生成模型的跨模态检索方法,该方法可以学习跨模 ...

最新文章

  1. python 两种多线程比较
  2. C#:WinForm无边框窗体移动方法、模仿鼠标单击标题栏移动窗体位置
  3. java代码快速_java代码编写快捷途经
  4. redis的zset的底层实现_Redis(三)--- Redis的五大数据类型的底层实现
  5. django-正向查询与反向查询演练-查询集的三种状态
  6. 清除SVOHOST.EXE的方法
  7. 18、OpenCV Python 简单实现一个图片生成(类似抖音生成字母人像)
  8. qt的qfiledialog怎么判断打开的是不是一张图片_花瓣网画板图片一键导出 设计师速来围观...
  9. UIWindow的rootViewController的问题
  10. android 锁屏壁纸时钟,桌面锁屏时钟下载-桌面锁屏时钟app安卓版v2.8.0-七度网
  11. 超全的人脸识别数据集汇总
  12. 百度云网盘批量复制文件,在线复制到每个文件夹中PC版
  13. Android基础之批量发送短信
  14. E.密码(算法选修)
  15. 应届生如何成功进入产品经理岗位
  16. 你怎么看欧阳娜娜空降阿里p8?
  17. IBM SPSS CLEMENTINE 下载安装
  18. continue用法
  19. Camtasia Studio2020官方最新版秘钥序列号版安装下载教程(一款超强录屏视频编辑软件)
  20. 酒饮赛道“破圈”风暴加速席卷 汇泉国际IPO能否掀起“资本浪花”?

热门文章

  1. win11系统正式版介绍
  2. 服务器导流板的作用,前保险杠下导流板的作用是什么?
  3. wcf高并发 mysql_WCF 高并发时客户端发送和服务端接收存在等待或延迟
  4. mongodb 可视化_自动爬取疫情数据、交互式地图可视化
  5. CSS3属性calc函数(CSS3)
  6. 户界面样式-表单轮廓和防止拖拽文本域(HTML、CSS)
  7. 二维绕任意点旋转_解析几何|对称,平移和旋转
  8. python网址编码转换_刚学python,抓中文网页遇到编码的问题,怎么转换也不行……...
  9. 区块链监管难题争论不休,这里具体谈谈辅助监管的四种技术
  10. 深入剖析WebRTC事件机制之Sigslot