MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件
作者 | 神经小兮
来源 | HyperAI超神经(ID:HyperAI)
内容提要:麻省理工学院在最近 ECCV 2020 上提交的一篇论文中,发布了一套自然灾害图像数据集。这是迄今为止规模最大、质量最高的自然灾害卫星图像数据集。
2020 年,多灾多难的一年。年初爆发的疫情,夏天南方的洪灾,近期美国加州的野火……
洪灾、山火、地震之类的自然灾害,总是威胁着人们的生命财产安全。而在无法避免其发生的情况下,如果能够及时、迅速地发现一些细微的变化,就能更好地制定相应救援方案,更合理地进行资源配置,同时也有助于进行相关新闻的报道。
因此,麻省理工学院的工程学硕士生 Ethan Weber 和合作者 Hassan Kan,在最新论文《Building Disaster Damage Assessment in Satellite Imagery with Multi-Temporal Fusion》(《具有多时相融合的卫星影像中的建筑物灾害破坏评估》)中提出了一个深度学习模型,能够对受损区域的卫星图像进行更快、更精准的评估,从而为急救人员争取更多的时间、最大程度地减少损失。
该论文在近期 CV 顶会 ECCV 2020 上发表
论文地址:https://arxiv.org/pdf/2004.05525.pdf
与此同时,他们还发布了一个最新的用于损坏评估的卫星图像数据集,让图像事件检测的相关研究更进一步,研究人员能实现更精确的定位和量化损失。
用 AI 与时间赛跑:加速灾情评估
对于自然灾害,现场应急小组减少反应时间,迅速响应、采取行动,对于减少损失和挽救生命至关重要。此外,为了更好地在受灾地区部署资源,应急人员必须了解损失的确切位置和严重性,这些同样重要。
目前,应急人员通常通过人力观察卫星图像的方法,来评估灾害损坏程度,但评估过程可能要花费数小时之久,这对于抢救工作极为不利。
人员观察分析卫星图像耗时耗力
是目前自然灾害评估工作中的一个瓶颈
Ethan Weber 的这项研究贡献在于,创建自动分析图像的工具,减少图像分析时间,赢得与时间的赛跑。
另外,其研究通过共享权值的 CNN(卷积神经网络),独立地提供灾前和灾后图像,可以获得更好的性能。
他们还提出了一种新的计算机视觉模型,该模型能够检测在 Twitter 和 Flickr 等社交媒体平台上发布的图片中的事件。
论文中提出的建筑损坏预测、评估模型架构
标记 19 种自然灾害的 22068 张图像
除了提出新模型外,该研究团队还重磅发布了一个新的事件数据集:xBD 数据集。
该数据集包含 22068 张图像,标记有 19 种不同的事件,包括地震,洪水,野火、火山爆发和车祸等。这些图像包括了灾前、灾后图像,图像可用于构建定位和损伤评估这两项任务。
飓风灾前图像(上图)与灾后图像(下图)
据介绍,xBD 数据集是迄今为止第一个建筑破坏评估数据集,是带注释的高分辨率卫星图像中规模最大、质量最高的公共数据集之一。其基本信息如下:
这些图像分辨率为 1024×1024,其中每个建筑物都有标识符,并在灾前灾后图片中保持一致。
但研究者发现建筑物的分辨率往往太小,模型无法准确绘制建筑物边界。为此,他们在 4 张 512×512 的图像上训练和运行模型,形成左上角、右上角、左下角和右下角象限。
根据这些灾前和灾后数据,损伤评估可以被定义为单时间和多时间任务。在单时间设置中,只有灾后图像被输入模型,该模型必须预测每个像素的损伤水平。在多时间背景下,灾前灾后图像都被输入到模型中,该模型必须在后图像上预测损伤程度。
团队综合多方资料,制定的损坏评估量表
数据集从何而来?
团队表示,这套新数据集旨在填补该领域的空白。现有数据集的图像数量和事件类别的多样性都受到限制。
作者还解释了如何创建数据集、如何创建模型以检测图像中的事件,以及如何过滤嘈杂的社交媒体数据中的事件。
他们的其中一项工作是,过滤了 4000 万张 Flickr 图片,来寻找灾害事件。另外一些工作则是可对地震,洪水和其他自然灾害期间,发布在 Twitter 上的图像进行过滤。
比如,该团队将与自然灾害相关的推文过滤为特定事件,并通过将推文频率与美国国家海洋和大气管理局(NOAA)提供的数据库相关联,来验证这一过程。
Ethan Weber 说:「我对这个数据集能够进行进一步的研究以检测图像中的事件感到兴奋,它也非常有效地激发了人们对计算机视觉界的兴趣。」
他还表示,社交媒体和卫星图像都是有助于应急响应的数据形式。社交媒体提供实地观察,而卫星图像提供宏观的观察(expansive insights),例如确定哪些地区受野火影响最大。
每逢灾害发生,网友通常会在社交媒体上发布实地拍摄照片。
正是意识到这种相互联系,Ethan Weber 和他的校友合作,在损害评估方面做出了卓越的成绩。
Ethan Weber 说:「现在我们有了数据,对定位和量化破坏很感兴趣。我们正在与应急组织合作,以保持专注并开展具有现实利益的研究。」
更多精彩推荐
鸿蒙加海思,麒麟加龙芯,组合拳能否渡劫“生态”危机
用 Python 详解《英雄联盟》游戏取胜的重要因素!
万字长文总结机器学习的模型评估与调参 | 附代码下载
“Talk is cheap, show me the code”你一行代码有多少漏洞?
科普 | 定义 Eth2.0 中的验证者质量
MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件相关推荐
- 【资源】MIT 更新最大自然灾害图像数据集,囊括 19 种灾害事件
By 超神经 内容提要:麻省理工学院在最近 ECCV 2020 上提交的一篇论文中,发布了一套自然灾害图像数据集.这是迄今为止规模最大.质量最高的自然灾害卫星图像数据集. 关键词:自然灾害 数据集 2 ...
- 小型图像数据集效果优化:使用预训练的CNN
面对解决小型图像数据集,一种常用且非常高效的方法是使用预训练网络.那么什么是预训练网络呢? 定义: 预训练网络(pretrained network)是一个保存好的网络,之前已经在大型数据集(通常是大 ...
- Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(持续更新)
Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新) 目录 CV常用数据集平台集合 Mendeley Data CAISA-Web ...
- Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)
Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新) 目录 CV常用数据集平台集合 Mendeley Data ...
- 智能安防场景:19类物品x光机图像数据集
安防数据采集与标注 2020年我国安防行业总产值为8510亿元,相比2019年的8260亿元仅增长3%,相比过去几年全年增长率都在15%以上,有着明显下滑,但主要原因还是在于疫情的爆发.随着今年3月份 ...
- Google更新最大的带注释图像数据集,添加本地化叙述
导语:对注释进行了极大的扩展 近日,Google AI 宣布发布 Open Images V6,和 V5 版本相比,它极大地扩展了 Open Images 数据集的注释,增加了大量新的视觉关系(例如, ...
- DOTA 数据集:2806 张遥感图像,近 19 万个标注实例
By 超神经 内容提要:DOTA 数据集是用于航拍图像中的目标检测的大型图像数据集.它可用于发现和评估航拍图像中的物体.无论从数量还是质量上来说,在同类型数据集中都具有很大优势. 关键词:航拍图像 遥 ...
- 常用图像数据集:标注、检索
http://www.csdn123.com/html/blogs/20131023/87499.htm 常用图像数据集:标注.检索 返回脚本百事通 1.搜狗实验室数据集: http://www.so ...
- 快速构建深度学习图像数据集,微软Bing和Google哪个更好用?
译者 | Serene 编辑 | 明明 出品 | AI 科技大本营(公众号ID:rgznai100) [AI 科技大本营导读]在本文中,作者将利用微软的 Bing Image Search API 来 ...
最新文章
- EXP/EXPDP, IMP/IMPDP应用
- ds oracle connector 连接组件,Datastage 8.5 连接远程Oracle 数据库
- redis 模糊删除实现
- 面向切面编程--AOP(二)
- C#面向对象名词比较
- js29--装饰着模式
- PathAnimation
- nginx 负载均衡的五中不同配置方式
- 关于rem自适应的一点研究
- 求相似三角形的几种方法,相似三角形算法有哪些
- 在线随机图片与网易云音乐解析API网页源码
- CSS中相对定位relative
- 使用RX方式模拟DoubanFm的登陆
- 微服务启动报错:Shutting down DiscoveryClient
- 实验室计算机远程访问设置(Teamviewer+Frp)
- VSCode的常用快捷键
- for_while循环作业
- 全面讲解Web3.0域名的应用场景-赛道情况-未来挑战
- img图片不显示问题
- Buuctf easycap