如何通过一张图片,找到另一张图片?

对于搜索引擎而言,寻找图片之间的内在联系,与常见的关键词搜索并没有本质区别——都是通过关键特征的比对,按照一定的逻辑规则完成匹配。然而不同之处也是显而易见的,以图片为输入发起的搜索,存在多种搜索含义的可能。比方,一张图片可能既包括风景又包括人,用户想要寻找的是类似风景、类似布局结构的图片还是类似的人?

谷歌的以图搜图功能,可以根据一张图片猜出拍摄地,但并不会尝试对图片中的人物精确匹配。多数搜索引擎都会如此。而且大部分以图片作为输入的搜索引擎,例如tineye(2008年上线)、搜狗识图(2011年上线)等,本质上是进行图片近似拷贝检测,即搜索看起来几乎完全一样的图片。2010年推出的百度识图(shitu.baidu.com)也是如此。

在经历两年多的沉寂之后,百度识图开始向另一个方向探索。

上周的百度年会中,李彦宏特意提到百度识图:“以图搜图的准确率从20%提升到80%”。不过与之前相比,百度识图找到相似图片的能力似乎并未显著提升,那么改变从何而来?李彦宏把这种明显的提升归因于刚上线的人脸识别搜索。

与之前的区别在于,如果用户给出一张图片,百度识图会判断里面是否出现人脸,如果有,百度识图在相似图片搜索之外,同时会全网寻找出现过的类似人像。新增加的技术简而言之,首先是人脸检测并提取出特征表达,随后再据此进行数据库对比,最后按照相似度排序返回结果。其实,人脸检测并不是新技术,相关研究已有三十年历史,然而直到去年底,百度才决定推动这一技术付诸实施。

里面自然有战略层面的考虑。两年前,李彦宏就对未来做出读图时代的判断;去年的KDD大会上,李彦宏提出的九大待解技术挑战中,基于内容的图像搜索技术被列在第三;现实层面百度的图片相关产品、云相册等均对这一技术有需求。百度还希望借助这一途径,挖掘图片之间的联系,进而激发二次浏览。

然而要把想法变为现实,百度至少要解决两个问题:一是算法,二是数据。

——算法方面。同样是基于图片进行搜索,人脸识别和以图搜图并不一样。百度资深工程师陶吉告诉创事记,百度人脸识别首先并不关注完整的图像结构,其次颜色也没有任何意义。最主要的特征表达来自于脸部纹理,并进行一些再加工。具体算法作为商业机密,难以对外界披露。不过资料显示,目前人脸识别算法中LBP是比较流行的一种特征提取方式,即通过像素周边8个临近像素的灰度值和中心灰度值比较,得到一个八位编码,然后再根据编码的直方图进行分类。而影响算法效果的因素还可能包括预处理、特征选择、特征点定位精度、分类器设计和后处理乃至各种方式的融合、阈值选择等各个方面。一张图片中,人脸至少有40×40像素(约一个指甲盖大小),才会被当作有效的识别对象。如果一张图片中多个人像,目前百度的解决办法是仅识别尺寸最大的那个,未来百度将提供焦点选择功能,用户可以通过选点确定搜索对象。

——数据方面。算法的改善如果算是充分条件,数据的处理则是必要条件。从机器搜索的角度看,光照、姿态、表情、角度等因素,均是影响巨大的因素,所谓“笑和不笑,都是不同”。所以用来训练的数据量越大,变化的包容性就越好。人脸识别搜索实际使用时,同一张人脸积累的数据越多,越能在匹配对比时提供更好的支持。为此百度需要把全网近百亿规模的图片抽取出来,然后把没有人脸的数据去掉,再海量扫描一遍,建立起尽量高效的索引。

人脸识别引入搜索引擎,必然会加剧外界关于隐私泄漏的担心。百度强调人脸搜索只会在公开的信息范围内进行,封闭的个人相册并不会被触及。

这还涉及准确率、召回率等概念。假设数据库里有一百张刘德华的图片,用刘德华的头像发起搜索,前50张结果中40张是真正的刘德华,那么前50张的召回率就是40%,准确率是80%。同样假如数据库中只有两张路人甲的图片,当用路人甲的头像发起搜索,前50张可能只有1张真正的路人甲,那么前50张的召回率是50%,准确率是2%。
     由于名人在网上的照片较多,能被用户感知到的准确率要比普通人高很多,而召回率是用户感知不到的。据透露,人脸识别搜索技术会在百度云相册内部进一步结合,帮助用户在图片之间建立联系,而且未来不排除开放API的可能。

除了上述技术讨论之外,从百度的研发体系看,人脸识别搜索也颇具代表性。

这个先后投入几十个工程师、百度基础技术部的多媒体部门负责核心算法的项目,去年11月下旬立项,12月底就已经上线运行。这个速度在百度并不常见,因此也有人半开玩笑的说这是百度近期“改作风”运动成效的代表。
     值得注意的是百度新成立的基础技术部。这个部门由百度首席科学家王海峰带领,并且直接向李彦宏汇报。据说一些李彦宏会亲自参与一些重点项目。自然语言处理、互联网数据挖掘、多媒体、推荐和个性化等技术研发,均由百度基础技术部负责。

还是在百度年会上,谈及近期遇到的挑战,李彦宏称百度不会忽视渠道的价值,但技术才是未来产业的关键。“相信技术的力量,未来就在我们手里”,李彦宏发出这样的号召。显然,百度的“变奏”已是必然要上演。

注:原文来自“互联网的那点事”,链接为:http://www.alibuybuy.com/posts/79416.html#jtss-tsina

百度人脸识别搜索是怎么实现的相关推荐

  1. 百度人脸识别搜索是怎么实现的?

    转自:http://www.alibuybuy.com/posts/79416.html#jtss-tsina 如何通过一张图片,找到另一张图片? 对于搜索引擎而言,寻找图片之间的内在联系,与常见的关 ...

  2. 基于Emgu CV+百度人脸识别,实现视频动态 人脸抓取与识别

    背景 目前AI 处于风口浪尖,作为 公司的CTO,也作为自己的技术专研,开始了AI之旅,在朋友圈中也咨询 一些大牛对于AI 机器学习框架的看法,目前自己的研究方向主要开源的 AI 库,如:Emgu C ...

  3. 调用百度人脸识别API进行人脸对比 C语言

    百度人脸识别api使用是免费的,有人脸对比.人脸搜索.人脸检测与属性分析三个功能,本文写的是人脸对比.这里给出百度人脸对比api的技术文档,请点击网址https://cloud.baidu.com/d ...

  4. 百度人脸识别技术应用001---百度人脸识别应用业务介绍

    1.最近在做人脸识别方面的APP,百度人脸识别分为,人脸识别离线SDK,需要输入序列号才能使用. 还有,在线API,关于,人脸识别离线SDK,前面已经在,AndroidStudio相关的文章中,写到了 ...

  5. 百度人脸识别API调用实现

    目录 一. 准备工作 A. 应用创建 1. 百度用户创建登录 2. 进入人脸识别服务 3. 应用创建 4.应用查看 B. 开发准备 1. 工具类下载 2. maven依赖注入 二. 调用实现 A. 看 ...

  6. 【探花交友】阿里云OSS、百度人脸识别

    文章目录 1.完善用户信息 1.1.阿里云OSS 1.2.百度人脸识别 1.完善用户信息 用户在首次登录时需要完善个人信息,包括性别.昵称.生日.城市.头像等.其中,头像数据需要做图片上传,这里采用阿 ...

  7. 百度人脸识别API 的使用

    百度人脸识别API 的使用 百度人脸识别API是一个第三方SDK,在此之前,我搜索过其他一些人脸识别的,相比较之下,我觉得百度的更加方便. 接下里,这是一个通过照片对比的demo,来教大家怎样使用百度 ...

  8. 利用百度人脸识别API和pyqt5实现基于人脸识别的可视化课堂签到管理系统

    利用百度人脸识别API和pyqt5实现基于人脸识别的可视化课堂签到管理系统 一.项目介绍 基于人脸识别的课堂签到管理系统 二.概要设计 工程项目:基于人脸识别的课堂签到管理系统 分为:三个阶段 1.定 ...

  9. 百度人脸识别sdk-转

    https://ai.baidu.com/ai-doc/FACE/Qk37c1mzc 目录 1.简介1.1 产品概述1.2 规格信息1.3 兼容性1.4 授权方式1.5 产品定价 2.SDK详细介绍2 ...

最新文章

  1. java批量下载文件为zip包
  2. 【.net部署】Server Error in ‘/‘ Application.错误解决方案
  3. 《淘宝店铺 大数据营销+SEO+爆款打造 一册通》一一2.2 实时直播抢占生意先机...
  4. python的flask实现接口_Flask快速实现简单python接口
  5. html里写js ajax吗,js、ajax、jquery的区别是什么?
  6. [转]配置nginx+apache 其中动态由apache处理,静态由nginx处理
  7. zookeeper使用及模拟注册中心原理
  8. MySql与SqlServer的一些常用用法的差别
  9. SpringCloud工作笔记063---Java 手机验证码生成_存储到redis
  10. mockito模拟依赖注入_Mockito间谍–部分模拟
  11. OpenVz Centos4 Oracle 10g VE
  12. 555定时器原理及应用(报告)
  13. html如何根据颜色排序,Excel技巧:按颜色排序或筛选
  14. 奥特曼系列ol星球破坏是哪个服务器,奥特曼里的“六大星球毁灭者”,每个都是轻松毁灭星球的存在...
  15. 在线副业教程之 01 如何通过编码赚钱的 6 种方法
  16. 用python自动制作ppt第一讲——了解11种默认布局
  17. 2010新浪笔试---数据挖掘
  18. 对口计算机平面设计考纲,云南体育运动职业技术学院2014年对口招生专业技能测试工作方案...
  19. Instruments
  20. 【UnityShader】光线追踪体积光

热门文章

  1. 免注册免登录,微信小程序 ChatGPT 智能问答一键体验
  2. char* char[] string
  3. 日志系统新贵 Loki,确实比笨重的ELK轻
  4. Django(5) - 自定义过滤器及标签
  5. python 修改pom文件_引用pom文件
  6. 08-Oct-2010
  7. 战争与征服服务器维护,战争与征服8月29日停机维护 火力压制主题周第一周开启...
  8. Java笔记-常用类String
  9. 10天学会英语常见词根后缀
  10. WIN10恢复旧版edge(原版edge)