点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

在没有gps信号的封闭区域内进行导航是一项极具挑战性的任务。为了解决这一问题,近年来基于图像的方法引起了许多研究者的关注。这些方法要么提取特征(如使用SIFT,或SOSNet),并将描述性的特征映射到相机的位置和旋转信息,要么部署一个端到端系统,直接从RGB图像中估计这些信息,类似于PoseNet。前一种方法在测试过程中计算量大,后一种方法对环境变化和物体运动缺乏准确性和鲁棒性。然而,端到端系统在测试和推断过程中非常快,并且非常适合实际应用程序,尽管它们的训练阶段可能比以前的要长。摘要小说多end-toend提出了大规模的室内定位系统,即APS(α定位系统),集Pix2Pix GAN网络重建输入的点云对查询图像,与深CNN网络以强劲估计相机的位置和旋转信息。在这种集成中,现有的数据集存在室内环境下成对RGB/点云图像的缺点。因此,作者创建了一个新的数据集来处理这种情况。通过实施提出的APS系统,作者可以实现高精度的相机定位,精度水平低于一厘米。

论文创新点

本文在[6,7]的基础上,提出了一种端到端深度神经网络系统,该系统一方面包含特定场景的RGB数据,另一方面包含与之对应的点云数据;然后集成他们,并提供相机位置和四元数估计与高精度。此外,与icp -net相比,该系统对图像部分遮挡、光照变化等环境变化具有鲁棒性。

框架结构

整个提出的APS工艺流程图

基于EfficientNet-B0 CNN的场景分类器。输入:RGB数据;输出:场景数量有关。

一种新的多模态回归因子CNNs。左侧路径仅在GAN输出获得的pointcloud数据上进行训练;只对RGB数据正确路径。

实验结果

通过插入掩模和在左上角的参考图像上完全滑动来增加数据。

使用对象插入来创建测试样本,以遮挡和屏蔽视图模式,以测试模型对屏蔽效果的鲁棒性。(上)场景的大视图,(下)从左到右:由于物体遮挡不同的相机视图和掩蔽模式。

结论

本文提出了一种端到端系统来解决室内定位问题。这项工作改进了之前提出的系统,即icp -net和激光雷达icp -net。由于背景中存在动态对象,ICPS-net具有较强的抗环境变化能力。激光雷达icp -net具有数据生成简单、抗输入变化能力强等优点。然而,它缺乏精确性。另一个创新是使用Pix2Pix GAN生成点云数据,这可以通过生成分布接近数据集的图像来帮助数据增强。虽然新的数据可以防止模型过拟合,但当输入的RGB图像被遮挡和遮挡时,它有助于提供鲁棒的点云数据。第三种新颖的是多模态CNN,它融合了两个独立的CNN模型,在回归精度和收敛能力方面都优于它们。笛卡尔坐标和四元数估计,相对于SOTA有了显著的改进。该模型的新颖之处简化了系统在各种应用中的利用,如大型建筑、商场、隧道和AR/VR应用。

论文链接:https://arxiv.org/pdf/2102.04139.pdf

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

- END -

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

APS:大型多模态室内摄像机定位系统相关推荐

  1. 苏州新导为南湖监狱量身打造的RFID室内人员定位系统解决方案

    ​ 一.监狱行业现状 我国目前的监狱人员管理现状,多数还停留在以狱警巡查加摄像机监视报警的阶段,人工作业仍占绝大比重,信息化程度比较低,而信息采集仍然只是单纯依靠手工输入,无法将信息系统和在押人员真正 ...

  2. 新导部队营房室内人员定位系统解决方案

    ​ 苏州新导作为抢先的物联网体系集成商利用现代化物联网技能手段,建立一套针对于部队的人员.车辆.配备.物资的归纳处理信息体系渠道.营房室内人员定位系统分利用智能卡技能.电子标签技能.二维码技能.智能传 ...

  3. 化工厂5G+蓝牙+LoRa室内人员定位系统解决方案

    随着化工行业的不断发展,化工厂的生产和管理工作变得越来越复杂和繁琐.人员定位成为一项重要的任务,尤其是在化工厂室内,为了确保员工的安全和提高工作效率,需要实现对人员的快速准确定位.因此,化工厂室内人员 ...

  4. aix系统计算时间差_室内人员定位系统

    室内人员定位是指使用无线通信,基站定位和惯性导航定位等多种技能,在室内环境中完成位置定位,从而集成一组室内人员定位系统,然后再集成人员和对象. 高精度的UWB室内人员定位系统可以满足工业人员和设备的定 ...

  5. 室内精准定位系统如何解决企业安全生产管理难题?

    室内精准定位是室外定位的技能延伸,被广泛应用于室内导航.店内导购.物品跟踪.消防安全.人员监控.智能工厂等等与人在固定场所流动相关的活动之中-- 室内精准定位需求呈爆炸式增长.据悉,2010年到202 ...

  6. OpenAI发布新一代大型多模态模型 GPT-4

    什么是GPT-4 ? GPT-4是一个大型多模态模型,可以接受文本和图像输入.GPT-4在各种专业学术基准上有着人类水平表现,例如模拟律师考试中,GPT-4的得分约为前10%,而GPT-3.5的得分约 ...

  7. 手机室内地磁定位软件_一种基于智能手机的室内地磁定位系统

    [1]谢仕民, 李邦清, 李文耀,等. 地磁匹配技术及其基本匹配算法仿真研究[J]. 航天控制, 2008, 26(5):55-59. [2]SUBBU K P, GOZICK B, DANTU R ...

  8. 室内人员定位系统-贵重资产定位系统-蓝牙信标

    我司(DONWIT东识)室内人员定位管理系统是依托互云计算.大数据.蓝牙定位技术.数据库技术.AI.视频分析技术对应急物资进行统一管理.分析的信息化.智能化.规范化的系统. 因为人的自我意识,对人员的 ...

  9. 智慧安防:监狱室内人员定位系统解决方案-新导智能

    现在,监狱安防触及的范畴非常广泛,除了视频监控,还涵盖围界.高压电网.报警.巡更.门禁.对讲.公共广播等其他方面.但在实际使用中,这些安防手法还不能满意监狱办理的要求.为加强对监狱人员办理的实时性和主 ...

最新文章

  1. XILINX资源获取
  2. Zipkin之外的选择:Skywalking vs Pinpoint
  3. Oracle-OLAP和OLTP解读
  4. 理清ThreadLocal、ThreadLocalMap、Thread之间的关系
  5. 世界上最奇特的国界线,万万没想到...
  6. 一文理解接口和抽象类
  7. AHB-lite时序详细解读
  8. 2-1 如何抓不同的接口(手机抓包,web网页抓包)
  9. android 车牌自动识别,Android端车牌识别可以用来实现摄像头扫描识别车牌?
  10. 竞赛保研(自动化专业)
  11. 遍历文件夹批量重命名
  12. python修改桌面壁纸_轻松有趣的Python小案例,让电脑自动更换壁纸
  13. 利用WireShark下载视频网站的流媒体视频
  14. 基于Robei:环境光传感器实验设计(及L298N模块控制LED灯板)
  15. html5动态效果随鼠标动,html5+CSS3心形动画跟随鼠标光标运动特效
  16. 师父韩晋文先生传授的八卦掌套路
  17. 可以看游资的app_新游资APP:高评分App是如何养成的?
  18. bzoj1778 驱逐猪猡 [高斯消元+概率DP]
  19. win10安装Ubuntu16.04
  20. 32种EMC标准电路 (共用)

热门文章

  1. 机器学习开源项目Top10
  2. Unsafe工具类的一些实用技巧,通往JVM底层的钥匙
  3. 面试官:为什么需要 Hystrix?
  4. 看看人家 SpringBoot 的全局异常处理,多么优雅...
  5. 放假看片时,一定要检查域名是不是 HTTPS ,不然……
  6. JAVA 线上故障排查完整套路,从 CPU、磁盘、内存、网络、GC 一条龙!
  7. 如何优雅的导出 Excel
  8. 为什么一定要前后端分离?
  9. 3438亿美元!互联网内容产业新机会
  10. 想做数据分析?这个比赛适合你!