开始之前，总体梳理一下项目流程，大致了解一下我们是怎么一步一步得到最终结果的

1、创建训练数据集

下载数据（链接：https://pan.baidu.com/s/1tM4ZXplEP2MC787OKSgt6A 提取码：achj）
克隆python环境（关于克隆环境和安装包上一篇有详细步骤）
添加Python包：scikit-learn和seaborn

1）-程序包管理器中“添加程序包”

2）-Conda或pip安装

4.打开工程文件

分析之前需要了解诸如海洋温度，盐度和营养物浓度之类的变量，以预测海草生长地点的适宜性。由于字段数据并不完美，并且通常缺少值，因此您需要填写值以完成原始数据，然后才能在分析中使用它们。

共有四个要素类：

EMU_Global_90m：生态海洋单位点数据，其中包含高达90米水深的海洋测量值。
Seagrass_USA：海草发生的面数据。Seagrass_USA中的每个多边形都是确定的海草栖息地。
US_coastline_shallow：美国海岸的多边形数据，其覆盖的测深范围一直到在Seagrass_USA中观察到海草栖息地的深度。
bathymetry_shallow：全局浅测深多边形，用于全局预测海草。

打开EMU_Global_90m属性表，变量包括盐度，海洋温度和硝酸盐含量等。但包含许多缺失值。这些属性将作为预测变量用于随机森林模型中。

4.1 使用【填充缺失值】工具，设置如下参数后运行。要填充的字段分别为：氧气、硝酸盐、磷酸盐、盐度、硅酸盐、srtm30和温度。

（注：警告消息是由于盐度、SRTM30和温度属性没有缺失值，但稍后需要用它们分析）

填充后的属性表如下

_STD字段显示用于估计缺失值的相邻数据点的标准偏差。

_ESTIMATED字段：若使用工具填充了属性，则为1，若数据已存在，则为0。

现在，我们已获得所需海洋变量的空间完整数据。

此时，蓝圈表示添加了新数据值，空白圆圈表示仅包含原始数据。

4.2 图层符号化

对EMU_Global_90m_Filled图层在符号系统中选择“单一符号”，选择“Circle1”样式，大小设置为6pt

4.3 创建训练数据

接下来，将创建随机森林预测模型需要的训练数据，探究海草密度与海洋状况之间的关系。训练数据集将由7个预测变量（海洋测量值）和1个结果变量（位置是否合适的海草栖息地）组成。

为了便于稍后使用的Python脚本访问，这些预测变量必须位于单个要素类中。所以需要创建一个新的随机点要素类，将海洋测量数据添加到每个点。

4.3.1 将视图导航至“弗洛里达”书签的位置

4.3.2 打开【创建随机点】工具，设置如下参数后运行，生成10000个随机点

4.3.3 打开【经验贝叶斯克里金法】，输入EMU_Global_90m_Filled图层。对于Z值字段分别输出下列每一个属性的栅格结果：

Z 值字段	Output raster
TEMP(备注：TEMP_UNFILLED)	temp
DISSO2 (备注: DISSO2_FILLED)	dissO2
NITRATE (备注: NITRATE_FILLED)	nitrate
PHOSPHATE (备注： PHOSPHATE_FILLED)	phosphate
SILICATE (备注: SILICATE_FILLED)	silicate
SRTM30 (备注: SRTM30_UNFILLED)	srtm30
SALINITY (备注: SALINITY_UNFILLED)	salinity

得到7幅栅格数据，类似下图

4.3.4 使用【提取多值到点】工具，设置如下参数运行，将上述7个属性的值提取到我们刚才生成的随机点中。

4.4 创建训练标签

为了让深度学习的模型了解什么样的海洋环境适合海草的生长，我们需要做一个简单的查询来区分在Seagrass_USA图层内（赋值1）或外（赋值0）的属性。

4.4.1 使用【添加字段】工具为USA_Train图层添加“Present”字段，设置为双精度类型

4.4.2 使用【计算字段】工具设置“Present”值为0

4.4.3 【按位置选择】“USA_Train”图层和“Seagrass_USA”图层【相交】的部分

4.4.4 再次使用【计算字段】工具，将选中要素赋值为1.

4.4.5 清空选择要素

流程

2、执行随机森林

之前，我们创建了具有8变量的训练数据集，这些数据有助于确定海草栖息地的适用性。现在，用准备好的数据和机器学习库来创建预测模型。

首先，检查变量的相关性，以确保随机森林分类是最佳选择。

随机森林是一种需要训练的有监督的机器学习方法，或者使用已知预测模型的数据集。

将数据分为两部分，一部分训练随机森林分类器，另一部分测试结果。根据结果的准确性，可以将模型应用于所拥有的全局数据，并将其保存为要素类。

2.1 将空间数据加入Python

导入所需要的模型库

2.2 选择分类

2.3 分割数据

2.4 训练随机森林分类器

最后将生成的“GlobalPrediction”图层添加到显示界面

3、评估预测结果

3.1使用【Kernel Density】，在环境选项卡中设置mask为Bathymetry_shallow。工具设置参数如下运行。

3.2 对结果图层【SeagrassHabitats】进行符号渲染，分类类型选择“拉伸”，配色方案选择Heat Map1

将图层属性的坐标系统中勾选“Enable wrapping around the date line ”，渲染结果如图所示

3.3 插入图框-激活-调整位置

3.4 插入文本框-设置标题

3.5 插入图例、比例尺……

ArcGIS Pro随机森林模型深度机器学习预测海草栖息地【教程】相关推荐

如何评估随机森林模型以及重要预测变量的显著性
如何评估随机森林模型以及重要预测变量的显著性说到随机森林(random forest,RF),想必很多同学都不陌生了,毕竟这些机器学习方法目前非常流(fàn)行(làn)--白鱼同学也曾分别分享过& ...
机器学习预测股票收益（一）之随机森林模型
机器学习预测股票收益(一)之随机森林模型前言一.导入库和数据二.处理数据以及计算特征变量三.使用随机森林回归预测股票收益 1.构建训练集和测试集 2.查看预测结果四.根据预测结果构建long ...
【ML】基于机器学习的心脏病预测研究(附代码和数据集，随机森林模型)
写在前面: 首先感谢兄弟们的订阅,让我有创作的动力,在创作过程我会尽最大努力,保证作品的质量,如果有问题,可以私信我,让我们携手共进,共创辉煌. 之前创作过心脏病预测研究文章如下: [ML]基于机器学 ...
随机森林原理_机器学习(29):随机森林调参实战（信用卡欺诈预测）
点击"机器学习研习社","置顶"公众号重磅干货,第一时间送达回复[大礼包]送你机器学习资料与笔记回顾推荐收藏>机器学习文章集合:1-20 机器学习 ...
论文解读+代码复现【AIDD】贝叶斯、决策树、随机森林+2种机器学习模型在癌症治疗药物发现中的应用
AIDD(AI Drug Discovery & Design):是近年来非常火热的技术应用,且已经介入到新药设计到研发的大部分环节当中,为新药发现与开发带来了极大的助力.倾向于机器对数据库信 ...
python天气数据分析论文_《Python数据分析与机器学习实战-唐宇迪》读书笔记第9章--随机森林项目实战——气温预测(2/2)...
第9章--随机森林项目实战--气温预测(2/2) 第8章已经讲解过随机森林的基本原理,本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模.特征选择. ...
kaggle项目：基于随机森林模型的心脏病患者预测分类！
公众号:尤而小屋作者:Peter 编辑:Peter 大家好,我是Peter~ 新年的第一个项目实践~给大家分享一个新的kaggle案例:基于随机森林模型(RandomForest)的心脏病人预测分类 ...
机器学习笔记十九：由浅入深的随机森林模型之分类
随机森林学习内容 1. 集成学习 2.sklearn中的集成算法 2.1 sklearn中的集成算法模块ensemble 2.2 RandomForestClassifier 2.2.1 参数 2.2 ...
python数据项目分析实战技法_《Python数据分析与机器学习实战-唐宇迪》读书笔记第9章--随机森林项目实战——气温预测(1/2)...
第9章--随机森林项目实战--气温预测(1/2) 第8章已经讲解过随机森林的基本原理,本章将从实战的角度出发,借助Python工具包完成气温预测任务,其中涉及多个模块,主要包含随机森林建模.特征选择. ...

ArcGIS Pro随机森林模型深度机器学习预测海草栖息地【教程】

1、创建训练数据集

2、执行随机森林

3、评估预测结果

ArcGIS Pro随机森林模型深度机器学习预测海草栖息地【教程】相关推荐

最新文章

热门文章