小样本学习&元学习经典论文整理||持续更新

核心思想

  该文使用基于孪生网络结构的CNN来实现相机的位姿估计和视觉伺服,过程也比较好理解,输入是当前位置的图像和期望位置的图像,输出的是两个图像之间的变换矩阵(包含平移矩阵和由四元数表示的旋转矩阵)。网络的结构如下图所示

孪生网络的两个分支分别对应当前位置图像IAI_AIA​和期望位置的图像IBI_BIB​,分别提取图像中的特征信息,然后将通道压缩至96,并且展成一维特征向量,再进行拼接。最后经过7个全连接层,输出7个预测结果(平移参数x,y,z和旋转四元数a,b,c,d)。损失函数如下


tit_iti​表示平移参数,qiq_iqi​表示旋转参数,RMSRMSRMS表示均方根误差。该文预测的结果其实是两幅图像之间的变换矩阵TΔT_{\Delta }TΔ​,而不是像传统视觉伺服那样输出对于速度的控制律,因此这里还是需要用其他的控制方法来实现期望的位姿变换。但相对于传统的视觉伺服方法,该文提出的方法能够在初始位置偏差比较大的情况下(如下图第三行,目标只有30%部分在视野中),还能够通过逐步迭代不断接近期望位置,这是传统视觉伺服中很难解决的问题(目标特征点不再视野中无法计算图像雅可比矩阵)

算法评价

  总体而言该文提出的方法更接近于相机的位姿估计问题,而不是视觉伺服,但本文提出的方法是可以应用于视觉伺服的任务的。另外本文发现使用孪生网络结构分别提取当前位置图象和期望位置图像的特征,再通过级联方式拼接起来,会比直接把两幅输入图像拼接起来进行特征提取效果要更好,这一点是与《Real-Time Deep Learning Approach to Visual Servo Control and Grasp Detection for Autonomous》这篇文章中的实验相吻合的。

如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。

论文阅读笔记《Siamese Convolutional Neural Network for Camera Pose Estimation and Visual Servoing》相关推荐

  1. 《Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs》论文阅读笔记

    <Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs>论文阅读笔记 主要挑战贡献: KG上的推理挑战主要 ...

  2. 论文阅读 | NIPS‘20 | Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs

    很有意思的一篇paper.在众多Knowledge Graph Embedding (KGE) 的论文中通过问题设计和有意思的解决方式脱颖而出. 首先来看看问题设计. 一般的KGE model都是利用 ...

  3. Beta Distribution Guided Aspect-aware Graph for Aspect Category Sentiment Analysis论文阅读笔记(EMNLP2021)

    目录 标题翻译:基于Beta分布引导方面感知图的方面类别情感分析 原文链接:https://aclanthology.org/2021.emnlp-main.19.pdf 摘要: 1 引言 2 相关工 ...

  4. Phrase-BERT: Improved Phrase Embeddings from BERT with an Application to Corpus Exploration论文阅读笔记

    问题: 因为bert是在长文本(512token长度)预训练的,因此,如果没有特定于任务的微调,BERT在短语和句子上的表现通常比简单基线(如GLoVe的平均池化)更差.且字节2020在EMNLP上的 ...

  5. DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记

    DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记 Article Background ...

  6. [论文阅读笔记] Are Meta-Paths Necessary, Revisiting Heterogeneous Graph Embeddings

    [论文阅读笔记] Are Meta-Paths Necessary? Revisiting Heterogeneous Graph Embeddings 购物返利 www.cpa5.cn 本文结构 解 ...

  7. 论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics(AAAI,2020)

    这是一篇非常有趣的工作,看完会觉得眼前一亮. 论文标题:Reasoning on Knowledge Graphs with Debate Dynamics 发表于AAAI,2020 动机  很多机器 ...

  8. 论文阅读笔记——《a simple but tough-to-beat baseline for sentence embeddings》

    <a simple but tough-to-beat baseline for sentence embeddings>published at ICLR 2017. ICLR会议的论文 ...

  9. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记

    我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...

  10. 斯坦福图机器学习CS224W笔记自用: Reasoning in Knowledge Graphs using Embeddings

    1. 基于嵌入的知识图推理 目标:如何对知识图进行多跳推理? 知识图推理: 回答多跳查询 路径查询 连接查询 Query2box 示例:生物医学图 知识图谱上的预测查询 我们是否可以进行多跳推理,即在 ...

最新文章

  1. 查询选修c语言课程的学生学号和姓名,数据库实验(学生信息表)
  2. MySQL——排序查询
  3. 使用dbcp连接池创建进行表的增删改查
  4. cname 别名记录 解析过程_云解析是什么?需要购买吗?
  5. 应行家算法_一些行家技巧和窍门
  6. 决心书之学习linux高级运维
  7. 空字符是什么类型_Redis是什么?看这一篇就够了!
  8. 1132: 零起点学算法39——多组测试数据(a+b)
  9. 一步一步写算法(之寻路)
  10. UVA-1635 数学
  11. 实验二 固件设计(小组)
  12. ceres拟合分段函数
  13. 【Vue实用功能】Vue实现浏览器全屏退出全屏
  14. 笔记本电脑wifi怎么连接
  15. Java程序员应该具备的辅助开发神器
  16. lnln(10 3.5 2)的c语言,ln10(ln对数表)
  17. Redis与传统sql数据库的区别
  18. 儒家思想的核心:仁、义、礼、智、信、忠、孝、悌、节、恕、勇、让
  19. CMake构建动态库
  20. 用什么方法可以改变摄像机逆光补偿

热门文章

  1. 搭建lxr搭建自己的代码检索网站
  2. sodo与visodo的日常使用
  3. MIPS Linux内核编译构建环境的搭建
  4. 关于mac重启/home目录丢失解决方案
  5. vue 所有dom加载完毕后操作dom节点
  6. 【目标检测】(10) Mosaic 数据增强方法,附Python完整代码
  7. 新生儿的二类(自费)疫苗(截止2019年)
  8. 基于Domoticz智能家居系统(十三)Domoticz-3.8153在Tiny6410开发板上的移植
  9. 这5个摸鱼神器太火了!程序员:知道了快删!
  10. “广告分佣+社交电商”:消费全返积分的电商模式