鉴于水下实验的高成本,高专业性,高复杂度的情况,开源水下数据集一直较为稀少。拥有数据的研究机构基本上也只限于自身使用。虎鲸开源计划致力于构建一个开放的实验平台,实验场地、硬件、软件、数据均在开源开放的范畴内。虎鲸开源计划期望能改善当前水下研究的条件,降低水下研究的门槛,促进水下研究的发展。

目前我们团队在虎鲸开源计划中开源了一个多波束前视声呐目标识别数据集UATD(Underwater Acoustic Target Detection)。数据集含10类目标,共9200张带标注的声呐图像。同时,数据集相关文章已发表于《Scientific Data》杂志,欢迎广大研究爱好者关注使用。另外不得不吐槽一下,杂志排版工作是印度团队做的,实在是太丑了,三哥真的不靠谱。我个人在arXiv上的版本链接我也会一并列出。文章doi如下:

A Dataset with Multibeam Forward-Looking Sonar for Underwater Object Detection | Scientific DataMultibeam forward-looking sonar (MFLS) plays an important role in underwater detection. There are several challenges to the research on underwater object detection with MFLS. Firstly, the research is lack of available dataset. Secondly, the sonar image, generally processed at pixel level and transformed to sector representation for the visual habits of human beings, is disadvantageous to the research in artificial intelligence (AI) areas. Towards these challenges, we present a novel dataset, the underwater acoustic target detection (UATD) dataset, consisting of over 9000 MFLS images captured using Tritech Gemini 1200ik sonar. Our dataset provides raw data of sonar images with annotation of 10 categories of target objects (cube, cylinder, tyres, etc). The data was collected from lake and shallow water. To verify the practicality of UATD, we apply the dataset to the state-of-the-art detectors and provide corresponding benchmarks for its accuracy and efficiency.https://doi.org/10.1038/s41597-022-01854-w

https://doi.org/10.48550/arXiv.2212.00352https://doi.org/10.48550/arXiv.2212.00352

在此简要说一下我们数据集的特色,详细情况还请直接阅读文章。

我们数据集最大的特色为提供前视声呐原始的回波强度数据。前视声呐输出的信息以距离和方位角为维度,为了满足人类的视觉习惯,厂商提供的前视声呐软件通常会对数据做一些处理,包括滤波和伪色彩等,最特殊的是输出图像是扇形处理后的。如下图:

处理后的声呐图像更方便人类操作员辨认目标,但滤波和伪色彩处理可能会导致部分数据丢失,扇形的图像在标注时可能会引入多余的信息(扇形区域外),这对于计算机目标识别算法的研究来说都是不友好的。

诚然,目前还是存在一些开源前视声呐数据集的,但这些数据集一来都是处理过的,二来数据集规模也较小,具体情况请参考文章。我们的数据与其它数据集数据对比如下图:

我们为历届全国水下机器人大赛(UPRC)线上赛目标识别赛声学赛道提供赛题数据。2022年的比赛地址如下:DC竞赛——领先的大数据与人工智能竞赛平台DataCastle(DC竞赛)是国内领先的大数据与人工智能竞赛平台,提供在线编程工具DCLab、数据集、开源分享和在线课程,积累20万数据科学领域用户。https://challenge.datacastle.cn/v3/cmptDetail.html?id=680

我们在大连金石滩和茂名好心湖等地采集了10类目标的数据,从中筛选质量较好的数据进行标注,最终选取9200张形成数据集。10类目标及其尺寸(m)如下图:

数据集分3个压缩文件:"UATD_Training.zip", "UATD_Test_1.zip", "UATD_Test_2.zip"。每个压缩文件内有两个文件夹,image文件夹存声呐图像,annotation文件夹存标注文件。Trainning压缩文件内含7600对数据(图像加标注),其余两个压缩文件内含800对数据。

一对数据范例如下图所示:

我们给出了采集数据时声呐的工作状态信息,包括量程,开角,声速,工作频率等,因为我们认为这些信息对声呐目标识别是有帮助的。具体标注文件中各参数请参考文章。

由于声呐数据的特殊性,我们还开发了一款用于声呐图像标注软件OpenSLT。软件的具体信息请参考文章。软件也打包为"UATD_OpenSLT.zip"和数据集一起开源了,里面的README.md可视为用户手册。

数据集经历了三次大赛的验证,当然我们也用一些通用的识别算法框架对数据集进行了验证。

文章中的数据集的链接地址是在figshare上,对国内平台不太友好。我们也将数据集上传到了虎鲸开源平台,但平台上的数据集是我们的早期版本,不是文章的配套版本,但差异不大,仅删除了一些无用的标注的参数项,以及一些参数名称的修正使之更准确。平台地址:

海洋空间环境感知(虎鲸)开源计划 - OpenI - 启智AI开源社区提供普惠算力!OpenI启智开源社区旗下的一站式AI开发协作平台,汇聚人工智能开源项目;提供代码托管、数据共享、模型训练等AI开发流水线功能;用户可在线使用鹏城实验室搭建的鹏城云脑、中国算力网的普惠算力,包含GPU、NPU等多样化加速资源。https://openi.pcl.ac.cn/OpenOrcinus_orca项目名为URPC2022_sonar_images_dataset,在项目的Dataset界面可以下载。

我们也将数据集上传到了百度云上,链接: 百度网盘 请输入提取码,提取码:33vg。

开源多波束前视声呐目标识别数据集相关推荐

  1. 基于ROS多波束前视声呐仿真模块的一些应用

    鼓捣前视声呐仿真模块也有一段时间了,在没有实际数据的条件下,选择仿真做一些算法的前期验证工作不失为一种选择,更多的是无奈的选择吧.长时间没有写点东西了,姑且记录一下前段时间的工作. 关于仿真的平台与声 ...

  2. 多波束前视声呐的矩形图转扇形图

    # -*- coding: utf-8 -*- """ Created on Fri Apr 1 16:18:44 2022 @author: WJJ "&qu ...

  3. 声纳---水下机器人前视声呐多目标跟踪技术研究--16年,哈工程,马珊,博士毕业论文

    (1)多目标跟踪硬件系统        多目标跟踪硬件系统由以下几部分组成: 前视声呐传感器.PC104计算机.电源模块.隔离器.硫化电缆线.网线等.        其中,前视声呐传感器釆用T ...

  4. Norbit多波束(iWBMS)和前视声纳(WBMS FLS)的使用简介

    Norbit多波束(iWBMS)是最近两年崛起的轻量级多波束产品,它的换能器是弧形的,与我们平常所见的Reson7125.T50P以及EM2040D的平面换能器不同.它的水下单元集成POS MV(Po ...

  5. 小议车辆环境视觉基础前视感知

    1. 前言 无论是AD/ADAS还是智能网联车,前视感知都是其最基础和重要的能力之一.自动驾驶(AD)是前几年的热门话题.今天虽然稍微降温下来一些,但仍是大家关注的重点之一,毕竟它是人类长久以来的梦想 ...

  6. pytorch每次迭代训练前都重新对数据集进行采样形成平衡数据集

    对于不平衡数据集的训练通常有两种方法: 一种是先用数据平衡的方法形成平衡数据集之后用于每一轮的训练,此时每轮训练的数据集是不变的,这一方法在pytorch的实现比较简单,即先构建好平衡数据集train ...

  7. python正则怎么取反_第11.19节 Python 中正则表达式的扩展功能:前视断言和前视取反...

    一.引言 在<第11.16节 Python正则元字符"()"(小括号)与组(group)匹配模式>中老猿介绍了组匹配模式的命名组功能及引用组功能,这两者都是组模式的扩展 ...

  8. 零点城市社交电商 2.1.7.4 独立版 全开源 含前后端VUE文件 全插件

    零点城市社交电商 2.1.7.4 独立版 全开源 含前后端VUE文件 全插件 前言 产品介绍 开发语音 获取源码 前言 零点城市社交电商最新版,独立版+前后端VUE+全开源+全插件,持续更新中,完美使 ...

  9. 第11.19节 Python 中正则表达式的扩展功能:前视断言和前视取反

    一. 引言 在<第11.16节 Python正则元字符"()"(小括号)与组(group)匹配模式>中老猿介绍了组匹配模式的命名组功能及引用组功能,这两者都是组模式的扩 ...

最新文章

  1. cache control 里 no-cache 和 no-store 的区别
  2. Linux 命令行上执行多个命令(分隔符简介使用)
  3. 一个男的和计算机对话,父与子的对话:计算机算法
  4. C# SNMP 编程
  5. Ceph的客户端安装
  6. 科大讯飞新一代语音识别系统揭秘
  7. Redis集群命令行部署工具
  8. kvm : virsh create *** 报错处理
  9. 拉普拉斯变换与拉普拉斯逆变换的常用结论与经典公式
  10. 嵌入式系统的性能评价
  11. 管家婆云辉煌的打印样式设置
  12. 地震管家(全球地震信息)
  13. Navicat导入mdf文件(用导入向导)
  14. 全球与中国服装测试、检验及认证市场深度研究分析报告
  15. python植树问题代码_小学数学最难的13种典型题,让孩子吃透了,拿高分不难!...
  16. 手把带你学会红外避障循迹模块
  17. Altium Designer 多引脚元件快速画法 Smart Grid Insert
  18. 工程测量测绘乙级按照标准办理
  19. UltraISO(软碟通)制作U盘启动盘完整教程
  20. vanilla_包装Vanilla JavaScript软件包以在React中使用

热门文章

  1. win10无法打开匿名级安全令牌_打开网页老提示来自网络的消息404 - 卡饭网
  2. 基于PyQt5实现界面控件自适应大小
  3. 为什么电脑邮箱收不到邮件,怎么回事?
  4. 嵌入式端音频开发(基础篇)之2021-2022年国内主流语音识别芯片科普(1)
  5. egg开发笔记(五)egg使用egg-sequelize需要注意的事项
  6. egg框架各个上下文中的this中有些啥?
  7. [第一讲]DSP28335将Flash中的代码拷贝到RAM中运行
  8. 利用java开发简易版扫雷游戏
  9. 关于上海数据中心新政PUE小于1.3的节能对策解读-孙长青
  10. centos7 更新网络源,下载扩展源时出现“one of the configured repositories failed”提示,解决方案