乾明 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

高尔夫球场,长期以来的高端社交地,但其存在的背后,却是对资源环境的侵袭。

不仅大量占用土地资源、耗费水资源,而且在维护草坪的时候大量使用化肥农药,会造成严重污染。

有多严重呢?

曾任江苏省副省长的徐鸣此前接受《中国经济周刊》专访给出了一个对比:

“一个高尔夫球场的污染比一座普通工厂的污染还要严重。”

从2004年开始,有关部门就开始出台一系列政策限制球场建设,并在2017年前后开展了专项清理整治。

但整治效果该如何核查?

球场相对分散,且占地面积比较大, 通过遥感图像来检测,是较优方案,高分辨率光学遥感影像的普及也为球场检测提供了有力数据支持。

哪怕这些数据都有,检测起来却不容易。

下面就是一张遥感图像,忽略绿框,你能发现其中的高尔夫球场有多少,都在哪吗?

一个熟练解译人员从这样的遥感图像中检测出来所有的高尔夫球场,需要15分钟左右。

而现在,深度学习技术改变了这项工作的面貌。

只需10秒,就能够在这样的图中,自动检测出高尔夫球场。

相比之下,效率提高90倍。识别的准确度也达到了84%。

这并不是个案特例,而是整个应用方向的集体提升,正切切实实发生在中科院遥感地球所。

这一跃迁是怎么发生的?又是一个怎样的过程?

AI在图像识别领域中已经颇有建树许多年,为什么到现在能力才体现出来?

想要回答这些问题,需要先回答——

为什么原来处理遥感图像很慢?

利用遥感图像监测地表,是一个持续的过程。

中科院遥感地球所研究人员说,其中最大的难点就在于,同一个地方的环境和气候,每年都会发生变化。

这会对理解遥感图像的算法造成极大的影响。

最直接的体现就是,原本针对这些地方构建的算法,过了一年之后,就要有针对性地调优,适应这些变化,不然就会“罢工”。

而且, 这些算法都与人的经验有很强的关联性,如果设计算法的人离职,整个算法就难以为继了。

需要注意的是,这些算法并不是自动化的,仍旧需要人工去配合。

中国960万平方公里,想要完成一遍,至少需要千余人集中工作2到3个月。

怎么办?可以用深度学习。现在, 遥感所是这样做的:

针对一个地方构建样本库,然后基于样本库中的图像训练深度学习模型。

第二年,这一地方的环境和气候发生变化,只需要把新的图像加进样本库,然后重新把模型训练一遍就可以了。

同时,这样也能够减少对人的依赖,模型的调整不再受限于专家经验,而是依靠数据的变化。

而且,数据越来越多,也不再是累赘,而是提高模型精度的“养料”。

虽然现在看来,这一切都很高效且非常简单。

但在从传统的人工+算法模式到现在深度学习的模式切换中,还经历了不少困难。

用AI理解遥感图像,有什么难的?

图像识别,可以说是当前AI领域比较成熟的技术了,各种用于图像理解的深度学习模型层出不穷,而且在特定领域已达到了人类同等水准。

但问题在于,这些深度模型,主要是针对自然图像的,如果直接用于理解遥感图像效果就会大打折扣。

因为这两类图像之间有很大的差别。

首先,遥感图像波段比较多,除了自然图像的RGB三个波段之外,遥感图像至少还要多出一个近红外波段,一些卫星获取的遥感影像有8个波段,高光谱图像甚至有多达200多个波段。

其次,图像的尺度差异也非常大,与自然图像中利用尺度金字塔进行多尺度的识别相比,遥感图像的尺度差异甚至要达到1:30 以上,才能较好地识别各个目标地物。

第三,有局部空间特征失真的问题。自然图像的失真,主要是因为传感器的边缘失真和镜头失真,整体是可控的。但遥感图像成像的失真,是由于在图像获取中的误差产生的,相对来说是不可控的。

这些问题的存在,让现有的深度学习算法很难直接应用到遥感图像理解任务中。不仅模型需要进一步优化,还需要框架提供支持:

不仅要在遥感影像读入方面提供多波段的支持,还需要添加针对遥感影像的图像增强算法,考虑到多波段的颜色增强,以及局部空间特征变形增强等等方面。

这些,正是百度在其深度学习框架PaddlePaddle中所做的事情,借助这一框架,中科院遥感地球所,也正在完成一轮新的技术迭代。

应用正越来越广泛

具体到我们一开始提到的高尔夫球场识别问题,中科院遥感所的研究人员借助PaddlePaddle框架的支持,使用了Faster R-CNN目标检测模型。

在专业、标准的高尔夫球场遥感数据集中,只需要10秒,就能够检测出遥感图像中的所有球场。

用人工+算法来识别,则需要15分钟。

深度学习新方法让工作效率提高了90倍,检出准确率也能够达到84%。

而且,深度学习并不仅仅只是用于自动化检测高尔夫球场,还正在被用于理解遥感图像中的机场,建设在山区中的风力和光伏发电站。

借助深度学习技术,研究人员能够根据遥感图像快速识别出一个地区有多少太阳能面板,就有可能对这一地区能够发多少电有清晰的预估,并为电网建设提供决策支持,避免“有电没网”或者“有网没电”的窘境。

根据国家能源局给出的数据,仅2018年,光伏发电就浪费了54.9亿度,相当于200多万家庭一年的用电量(按一家庭每月用电200度来计算)。

这背后的社会价值可见一斑。

而且,理解遥感图像,只是PaddlePaddle解决实际问题的一个范例。

在计算机视觉领域,这个框架已经能够支持模型完成图像分类、目标检测、图像语义分割、场景文字识别、图像生成、人体关键点检测、视频分类、度量学习等任务。

最后,附上一篇使用指南。如果你感兴趣,可以收藏观看~

计算机视觉八大任务全概述:PaddlePaddle工程师详解热门视觉模型

订阅AI内参,获取AI行业资讯

加入社群

量子位AI社群开始招募啦,量子位社群分:AI讨论群、AI+行业群、AI技术群;

欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“微信群”,获取入群方式。(技术群与AI+行业群需经过审核,审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

谷雨钜献 | 用深度学习理解遥感图像,识别效率提升90倍,PaddlePaddle中科院遥感地球所...相关推荐

  1. 这个深度学习工业质检工具,效率提升30%,质量提高80%

    在制造业的大量中小企业中,仍然有大量流水线依赖人力进行产品配件安装,这导致在生产过程中会出现错.漏配件的情况,不仅会直接影响企业的产品品质,更会对使用的消费者带来隐患.因此,企业需要配备产线品控人员, ...

  2. 中科院DeepMind联手,用深度学习揭示大脑如何识别人脸|Nature子刊

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI Deep ...

  3. 深度学习:在图像上找到手势_使用深度学习的人类情绪和手势检测器:第2部分

    深度学习:在图像上找到手势 情感手势检测 (Emotion Gesture Detection) Hello everyone! Welcome back to the part-2 of human ...

  4. 深度学习:在图像上找到手势_使用深度学习的人类情绪和手势检测器:第1部分

    深度学习:在图像上找到手势 情感手势检测 (Emotion Gesture Detection) Has anyone ever wondered looking at someone and tri ...

  5. 用深度学习做命名实体识别(五)-模型使用

    通过本文,你将了解如何基于训练好的模型,来编写一个rest风格的命名实体提取接口,传入一个句子,接口会提取出句子中的人名.地址.组织.公司.产品.时间信息并返回. 核心模块entity_extract ...

  6. 超分辨率 | 综述!使用深度学习来实现图像超分辨率

    关注公众号"AI算法修炼营",选择"星标"公众号 精选作品,第一时间送达 今天给大家介绍一篇图像超分辨率邻域的综述,这篇综述总结了图像超分辨率领域的几方面:pr ...

  7. 基于深度学习的命名实体识别研究综述——论文研读

    基于深度学习的命名实体识别研究综述 摘要: 0引言 1基于深度学习的命名实体识别方法 1.1基于卷积神经网络的命名实体识别方法 1.2基于循环神经网络的命名实体识别方法 1.3基于Transforme ...

  8. NLP入门(五)用深度学习实现命名实体识别(NER)

    前言   在文章:NLP入门(四)命名实体识别(NER)中,笔者介绍了两个实现命名实体识别的工具--NLTK和Stanford NLP.在本文中,我们将会学习到如何使用深度学习工具来自己一步步地实现N ...

  9. 基于深度学习的人脸性别识别系统(含UI界面,Python代码)

    摘要:人脸性别识别是人脸识别领域的一个热门方向,本文详细介绍基于深度学习的人脸性别识别系统,在介绍算法原理的同时,给出Python的实现代码以及PyQt的UI界面.在界面中可以选择人脸图片.视频进行检 ...

最新文章

  1. Matlab某医院用光电比色计,数理统计答案(研究生).ppt
  2. 2020 操作系统第一天复习(习题总结)
  3. 根据条件查询某条记录的条数_「性能与架构」MySQL 8 查询优化新工具 Explain Analyze...
  4. 简自动类型提升,精度损失类型强制转换,常用转义字符,简单帮你回顾Java基本数据类型整形浮点型字符型布尔型Boolean及其运算规则
  5. OAuth 2.0 - Authorization Code授权方式详解
  6. Struts2知识点总结
  7. 解决使用sudo没问题,但是使用su会报错 su: Authentication failure 的问题
  8. 区块链开发入门书籍和文档
  9. 2018年广西计算机一级,关于2018年上半年广西壮族自治区全国计算机等级考试报名工作的通知...
  10. Microsoft Excel 不能访问文件
  11. 大公司面试c语言收集(6)
  12. 如何求递归算法的时间复杂度
  13. 9个常用的免费高清壁纸图库网站
  14. 六十星系之14廉贞贪狼坐巳亥
  15. Oracle中insert into select和select into的用法(异常0RA-00905:missing keyword的解决)
  16. flink sql 知其所以然(八):flink sql tumble window 的奇妙解析之路
  17. 如何安装微软的Linux发行版CBL-Mariner 1.0
  18. 滑动窗口—至多包含两个不同字符的最长子串(leetcode 159)
  19. 中粮集团-“我买网”领导说了:
  20. 21_ue4进阶末日生存游戏开发[行为树]

热门文章

  1. 如何让你的代码没有Bug?GitHub排名第一的项目提出了一劳永逸的方法
  2. 来来来!docker-composeup很慢
  3. 同轴全息matlab仿真,HoloSpec2D 二维全息谱的matlab程序,含有频谱校正 276万源代码下载- www.pudn.com...
  4. mysql 幻读和不可重复读_幻读和不可重复读的区别
  5. 服务器虚拟化 远程,服务器虚拟化 远程
  6. 10怎么读_孩子学习浑浑噩噩,做事拖拖拉拉,老是做不完作业,家长怎么办?...
  7. HTTP/2中的二进制分帧
  8. Vue的批量更新原理
  9. php vue seo,处理 Vue 单页面 SEO 的另一种思路
  10. JAVA延迟执行(thread方式和timer方式)