最直接的,训练数据以“图片对”(image pair)为单位,标签是相似度,把这样的数据输入神经网络,最终网络模型能够回归出输入图片对的相似度;

于是第二个步骤来了,怎么样给训练数据打上相似度?手工标注。有没有更准确的、更快的呢?有,用深度学习模型来标注两张图像的相似度,怎么做的?看问题描述加上步骤1就行。流程递归,卡死了,无解。

既然步骤1里面“最直接的”不可以,那就间接来解决。转入步骤4

间接来说,我们既然不知道如何准确标注具体的、取值区间在0~1的连续的相似度,那么粗糙一些,标注离散的相似度:0表示不像,1表示很像。比如把英短猫和美短猫组成的图片对标注成1,英短猫和哈士奇组成的图片对标注成0,损失函数使用逻辑回归这种soft的概率回归形式,就可以了。只要图片对的标注足够充分,效果就会很好。前面有答主回答的Siamese Network就是这样的。这样子做,我们有了一个基于二分类的网络、输出相似度的模型。

但是问题又来了,如果构造一个充分的训练集,要给一千种、每种有好多张图片的数据两两之间标注0和1,这是一件很可怕的事情:如果你每种图有100张,总共有10万张图片,那么可以构成

这么多的图片对,显然这根本很难训练完成,更何况10万的数据集已经是一个很小的数据集了。

那么再间接一些,不用0和1表示像与不像了,用0, 1, 2, 3, 4...999,表示一千种不同的类,把只有两种分类的逻辑回归损失函数,换成有n种分类的softmax损失函数。这样子,理论上softmax给每个类一个“中心”,每个中心都是一个高维向量,每个类的中心都和其他的类中心尽量的“不像”,用数学来说就是余弦越小。然后呢,我们让同一类的图像,尽量往自己的中心上去靠,靠的越近、越紧,就越好。这样子,美短猫都紧密团结在美短猫的中心上去了,哈士奇都紧密团结再哈士奇的中心上去了。训练结束,“最美短猫”的美短猫离自己的中心靠的最近,“不那么美短猫”的美短猫距离美短猫中心靠的比较远,而哈士奇离美短猫中心靠的就很远很远了,离自己的中心比较近。这样的就比较好能解决我们的问题了。输入了图像,我们能得到图像的一个特征向量,输入另一个图像得到另一个特征向量,用余弦函数比比他们的距离,相似度就有了。前面有答主说的用imagenet上pretrain模型,使用两张图的最后隐层的向量输出,求余弦做相似度就是这个道理。

然后就得到了用深度学习判断两张图片相似度的方法。更高级的知识,请深入学习metric learning和深度学习结合的相关知识。

halcon 相似度_怎样用深度学习判断两张图片的相似度?相关推荐

  1. 怎么看两张图片的相似度,判断两张图片的相似度

    C#怎么来判断2张图片相似度 很麻烦,而且计算量很大,这个属于人工智能的范畴.如果这"两张相似图片"可以规定很多前提,比如相同分辨率,黑白,简单几何图形... 那么可以用基本的算法 ...

  2. 深度学习 对比两张图片的差异_什么是人工智能、机器学习和深度学习,三者之间又有什么差异?...

    深度学习改变了很多产业,吴恩达(Andrew Ng)曾在他的推特上这样描述:Artificial Intelligence is the new electricity!(人工智能犹如新型电力!)电能 ...

  3. Python如何比较两张图片的相似度

    前言 本文是该专栏的第21篇,后面会持续分享python的各种干货知识,值得关注. 工作上,可能会需要你对两张图片进行相似度比较.比如现在的图片验证码,需要你对两张图片进行比较,找出图中存在相似特征的 ...

  4. DSSM、CNN-DSSM、LSTM-DSSM等深度学习模型在计算语义相似度上的应用+距离运算

    在NLP领域,语义相似度的计算一直是个难题:搜索场景下query和Doc的语义相似度.feeds场景下Doc和Doc的语义相似度.机器翻译场景下A句子和B句子的语义相似度等等.本文通过介绍DSSM.C ...

  5. 深度学习AI美颜系列---肤色相似度计算(CIELAB色差计算)

    深度学习AI美颜系列---肤色相似度计算(CIELAB色差计算) 在AI美颜中,经常会用到肤色相似度计算,如何实现这个算法? 步骤如下: 1,人脸皮肤分割: 2,对人脸皮肤分割结果进行LAB颜色空间转 ...

  6. halcon 相似度_列举一些算法对照片、图像进行相似度对比分析比较

    packagecom.aliyun.picture.demo;/*** @BelongsProject: maven-demo * @BelongsPackage: com.aliyun.pictur ...

  7. RS中深度学习的两类方法:表示学习和匹配函数学习

    目录 1 基于表示学习 1.1 无序交互 MLP 自动编码器AE 注意力机制 1.2 序列交互 RNN CNN 注意力机制 1.3 多模态内容 分类属性 用户评论 多媒体内容 1.4 链路图 端到端: ...

  8. Python计算两张图片的相似度

    目录 一.场景需求解读 二.Mean Squared Error (MSE)简介 三.The Structural Similarity Index (SSIM)简介 四.算法代码实现 五.效果展示与 ...

  9. 基于深度学习的病理_组织病理学的深度学习(第二部分)

    基于深度学习的病理 计算机视觉/深度学习/医学影像 (COMPUTER VISION/ DEEP LEARNING/ MEDICAL IMAGING) In the last part, we sta ...

  10. 时间序列多步预测_使用LSTM深度学习模型进行温度的时间序列单步和多步预测...

    本文的目的是提供代码示例,并解释使用python和TensorFlow建模时间序列数据的思路. 本文展示了如何进行多步预测并在模型中使用多个特征. 本文的简单版本是,使用过去48小时的数据和对未来1小 ...

最新文章

  1. 《智慧书》格言241-250
  2. Python kmean-opencv
  3. 性能提升约 7 倍!Apache Flink 与 Apache Hive 的集成
  4. sql oracle 自增长字段,在Oracle、MySQL、MS SQL Server中创设自动增长字段
  5. 一加7充电_一加真无线耳机曝光,65W快速充电器获认证
  6. hive 和mysql配置_Hive学习和配置Mysql
  7. 三星Galaxy A90翻转摄像头出变故:或仍将采用水滴屏设计
  8. centOS下安装tomcat详解
  9. 如何应对被地下的Oracle口令加密算法(2)
  10. 【深度好文】多线程之WaitHandle--派生-》Mutex信号量构造
  11. .NET Core跨平台:.NET Core项目部署到linux(Centos7)
  12. 小甲鱼python作业百度文库_【小甲鱼python课后题.doc】下载 - 面包树
  13. AutoCAD 2022 Mac中文版发布 最好的Mac CAD软件
  14. 大学计算机专业高考听力,2018北京高考英语听力一年两考,其他省市如何进行?...
  15. 暗时间 pdf_时间管理最全的一篇:理论+实践+电子书
  16. 如何申请免费163邮箱?如何申请163邮箱账号?
  17. 排队器拦截_如何绕过浏览器的弹窗拦截机制
  18. 卸载红蜘蛛多媒体网络教室
  19. java学习笔记(23)java表单标签
  20. winsat查询windwos里disk、mem、cpu性能

热门文章

  1. 货币的时间价值及股票估值
  2. 怎么样锁定计算机时间,电脑屏幕锁屏设置时间还是锁不了怎么办
  3. macbook双系统怎么装mysql_mac电脑安装window双系统方法和注意事项
  4. 计算机考研复试-《数据库》篇
  5. java获取某天时间的最小值和最大值 00:00:00 与 23:59:59
  6. 部署免安装版MySQL
  7. Field属性(域)
  8. CRM 客户管理系统(SpringBoot+MyBatis)
  9. EXCEL 数据比对查询好用的指令——VLOOKUP 三种使用场景
  10. 手把手教你升级苹果ID为免费开发者帐号