在做自然资源类项目的时候,因为各种原因,会产生大量的细碎图斑,这些图斑可能是外业采集的时候本身就是细碎的,也有可能是因为各种后期处理生成的(比如用村界去切割地类图斑的时候,也会生成大量的细碎图斑)如下所示:

图1:碎片图斑

当然还有的本身不是细碎图斑,但是因为形状非常怪异,导致制图的时候非常难以处理,也会需要作为细碎图斑识别处理加以处理,比如下面这几个图斑:

图二:碎片及带有小尖角的不规则图斑

图三:狭长的不规则图斑

图四:构造形状不规则图斑

(这种图斑,多半是由于多个地块融合的产生的,形状非常诡异)

这些图斑,都被认为是细碎图斑,需要从数据中识别出来,说到这里,做自然资源类项目的同学肯定已经深恶痛绝了……这个根本就是无解的难题啊。

所以有时候虾神去见客户粑粑的时候:

遇上这种情况,每次我的心里都是:

所谓的人工智能,目前主流的就是:

干活的时候,全是人工

写PPT的时候,就是智能了

讲道理,如果仅仅是细碎的碎片要处理,简单一句话,面积小于xx平方米的,统统一刀切……但是图三图四图五怎么办呢?当然,国土里面,还有一些指标,比如地块规则度的测量,比如形状率,圆形率,椭圆率指数,放射度指数、紧凑度指数等等,来识别这些图斑,但是每个地方都有每个地方不同的特点,任何情况下,都不可能做到用一个数值进行一刀切,这种情况怎么办呢?

如果没有固定的阈值指标,而只能“凭感觉”处理,那么有没有一种方法,能够尽量的减轻人工劳动呢?答案就是采用机器学习

虽然说,我们不能给出所有的细碎图斑的指标值,但是总体说来,作为细碎图斑,还是一定的特征可以识别的,比如面积比较小,或者形状很不规范,又比如正好在若干大斑块的中间等等,但是这些特征如果要用数值来进行表达,可能非常的复杂,单单是“形状怪异”这个一个形容词,可能就需要几十个甚至上百个特征变量来描述,我们需要人工总结出这些复杂的特征,并且转换成if……else……编码来实现,几乎是一个不可能完成的任务。

而复杂性这个怪兽,我们也并非无可奈何,机器学习就是我们对付复杂性问题的一个卓有成效的武器。

我们仅需要把数据扔进去,就可以让系统自动的去构建需要识别的特征模型——这就是机器学习的神奇之处。

那么既然叫做机器学习,很核心的一点,就是“学习”二字,那么用人类可以解释的语言来说,一个学习的过程,需要有老师、教材、传授、接收、掌握……等一系列过程,机器学习也是一样。

具体机器学习的各种概念,大家可以到网上去找相关资料,绝对的汗牛充栋,我这里就不献丑了。

最后,给出一个题外话,下文有福利哦:

前段时间,有篇文章刷屏了,说的国内某度和国外的某歌的区别,比如在某度上搜索如下关键字:

然后同样的关键字在某歌上进行搜索:

结论是大家一致声讨某度的(福)(利)(啊),那么为什么white度,在很多时候,都变成了yellow度呢?从技术角度来说,真心不是某度的锅。

(上面文章原文链接:https://zhuanlan.zhihu.com/p/41800888,当然,现在上某度,已经无法搜到这些信(福)息(利)了)

那么到底是什么原因呢,如下所示:

以上漫画纯属虚构,某度的搜索机制和算法要比这个高端大气上档次个百八十倍的,虾神这里只是纯粹根据原理进行胡说而已,大家切勿当真

上面的小案例中,机器会根据输入的信息,不断的调整系统内部的模型,以做出最优解,这个过程并不需要程序员进行人工干预,这就是机器学习的主要特点之一。相当于对系统进行搜索和确认的用户,就是老师,而机器就是学生,当然,这里大批量的“老司机”把模型给带沟里面去了,这个问题现在有,将来依然会不断的出现。

从下一篇开始,我们讲开始进入机器学习实战的阶段,第二篇主要讲技术路线,待续未完。

利用机器学习识别细碎图斑实战(1):前言相关推荐

  1. 利用机器学习识别细碎图斑实战(2):技术路线

    本节主要讲利用机器学习做细碎图斑识别的技术路线,我们以后将按照这个技术路线完成整个过程. 首先看看整个技术路线图: 整个流程总共分成七个步骤,这七个步骤也是项目分析类任务的标准流程,下面我们简单来解释 ...

  2. 利用机器学习识别细碎图斑实战(3):探索性数据分析

    先对数据进行声明: 本文使用的数据已经经过了一系列脱密处理,不代表任何区域位置的真实信息,仅能用于学习和练习,提供者不对真实性负责,也不得用于任何盈利性的活动或者公开.出版等用途. 本来应该是要写数据 ...

  3. 利用机器学习识别验证码(从0到1)

    最近喜欢先把测试结果图放前面.大家可以先看下效果. 识别速度并不是很快,代码并没有进一步优化. 本篇主要讲的是 从制作验证码开始,到我们利用机器学习识别出来结果的过程. 利用机器学习识别验证码的思路是 ...

  4. python机器学习手写字体识别_Python 3 利用机器学习模型 进行手写体数字检测

    0.引言 介绍了如何生成手写体数字的数据,提取特征,借助 sklearn 机器学习模型建模,进行识别手写体数字 1-9 模型的建立和测试. 用到的几种模型: 1. LR,Logistic Regres ...

  5. 用机器学习识别不断变化的股市状况—隐马尔可夫模型(HMM)股票指数预测实战

    "了解不同的股市状况,改变交易策略,对股市收益有很大的影响. 弄清楚何时开始或何时止损,调整风险和资金管理技巧,都取决于股市的当前状况. ▼ 有些策略在波澜不惊的股市中表现良好,而有些策略可 ...

  6. 【白话机器学习】算法理论+实战之LightGBM算法

    1. 写在前面 如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的,在这简单的先捋一捋, 常见的机器学习算法: 监督学习算法:逻辑回归,线性回归,决策树,朴素贝叶斯,K近邻,支 ...

  7. 【白话机器学习】算法理论+实战之Xgboost算法

    1. 写在前面 如果想从事数据挖掘或者机器学习的工作,掌握常用的机器学习算法是非常有必要的,在这简单的先捋一捋, 常见的机器学习算法: 监督学习算法:逻辑回归,线性回归,决策树,朴素贝叶斯,K近邻,支 ...

  8. 【玩转华为云】手把手教你利用ModelArts识别偶像的声音

    本篇推文共计2000个字,阅读时间约3分钟. 华为云-华为公司倾力打造的云战略品牌,2011年成立,致力于为全球客户提供领先的公有云服务,包含弹性云服务器.云数据库.云安全等云计算服务,软件开发服务, ...

  9. 秒懂机器学习---k-近邻算法实战

    秒懂机器学习---k-近邻算法实战 一.总结 一句话总结: k临近算法的核心就是:将训练数据映射成k维空间中的点 1.k临近算法怎么解决实际问题? 构建多维空间:每个特征是一维,合起来组成了一个多维空 ...

最新文章

  1. pycharm报错(Non-zero exit code (2))与手动安装报错
  2. 相对于oracle数据库的作用 类似于,郑州大学软件技术学院Oracle试卷
  3. 在靶场测试ICMP隧道
  4. hbase hmaster启动起来就自动关闭
  5. Android学习笔记---19_采用ListView实现数据列表显示,以及各种适配器使用,和如何写自己的适配器
  6. require include php5中最新区别,百度上好多错的。
  7. android shell强制删除文件夹_原来手机中的这些文件可以删除,难怪手机越用越卡!...
  8. 《从零开始学Swift》学习笔记(Day 53)——do-try-catch错误处理模式
  9. 电子工程师常用的单位转换
  10. 香港TVB40年武侠情侣
  11. RFID通信系统框图
  12. Maven查看当前生效配置、pom、环境变量等命令(mvn help用法)
  13. 解决讯飞语音唤醒参数无效(错误码:10106)的问题
  14. java在win8闪退_win8.1应用闪退
  15. UAC绕过学习-总结
  16. Excel VBA: 自动生成巡检报表并通过邮件定时发送
  17. Perl函数及参数介绍
  18. python漂亮的gui_python开发的gui漂亮吗
  19. 拜水野三坡 求得一身财气
  20. IOS开发 阅读器类APP可用开源框架介绍(2)

热门文章

  1. Radware研究发现,数据泄露将成为最大的网络攻击问题
  2. java : java -jar,java -cp,jar cvf 命令详解
  3. 潍坊科技学院五专部计算机应用基础试题,计算机应用基础考试试题B
  4. 易能机器人_江西工程学院在江西省大学生智能机器人大赛中获佳绩
  5. am命令基本知识详解
  6. Access 数据库
  7. 一定时间后延时变长问题
  8. 考研政治——马克思原理唯物论之社会形态更替
  9. “四国军棋界面的EclipseRCP实现”开发进度(未完成)
  10. 3.2V 磷酸铁锂电池充电芯片介绍--FS4057B