论文标题:
Pest incidence forecasting based on Internet of Things and Long Short-Term Memory Network
基于物联网和长短记忆网络的害虫发生率预测

论文地址:https://doi.org/10.1016/j.asoc.2022.108895

摘要

荔枝臭虫(Tessaratoma papillosa)的侵染一直对龙眼人工林的产量产生重大影响。害虫防治对于农民在有效减少损失的同时发现并及时抑制害虫的发生至关重要。环境因素,特别是气候变化,导致害虫数量不断增加,而天气再不同的地形、地点和时间可能会有所不同。由于台湾的地理和地形条件,本研究重点调查亚热带坡地上具有明显季节变化的水果种植。本文旨在基于长短时间记忆网络(LSTM)预测气象数据,并通过机器学习(ML)识别虫害与环境因素之间的相关性。本节将概述研究的结构和实验过程。在第一阶段,通过自行设计的物联网系统和无线远程传输技术获取试验场地的气象信息。由于预测的气象信息以时间序列的形式显示,因此使用多层LSTM和双向LSTM来解决该问题。最后,将利用环境数据和虫害检测进行实地调查,通过KNN、支持向量机和随机森林模型预测害虫侵扰的严重程度。实验结果表明,LSTM在天气预报中表现良好,R平方值为96%,而机器学习(ML)进行有害生物预测的准确率为85%。该研究证实了气象因素确实影响害虫的发生率。例如,在适当的温度、湿度和阳光下,荔枝臭虫的数量很容易增加。LSTM在为统计中的长期依赖性提供解决方案具有优势。本文将介绍与海洋气候相对应的天气模式、气象条件和预测时间长度发生变化的区域,以及有害生物种群与环境因素之间的相关性。

1 引言

随着物联网应用和互联网技术的快速发展,传感器设备在各个领域的应用越来越广泛。例如,物联网可用于工业目的,以检测和预测系统状态,而在农业中,物联网是通过收集环境信息来观察植物生长的。基于物联网设备收集的大量数据的人工智能(AI)分析已成为一种重要机制,也称为人工物联网(AIoT)。人工智能的分析方法包括深度学习(DL)和机器学习,用于检查异常数据和预测即将发生的事件。作为未来的新兴技术,AIoT是人工智能和物联网的融合,有助于解释和分析数据,以确定问题的最佳解决方案。
最近,机器学习和深度学习被广泛用于预测未来数据,以优化业务流程、推动技术发展和升级金融交易。数据分析主要基于当前和历史数据、统计分析方法、预测模型和大数据训练的机器学习算法。通过上述新技术优化的模型允许程序员通过趋势分析准确预测未来结果,同时对不同的趋势提出合理的解释,并提出检查计划来管理未知或异常事件,以改进未来的操作模式。
在智能农业中,物联网概念和技术主要用于通过在对象中嵌入传感组件(例如生物、环境和图像识别传感器)来远程传感或控制农场上的物理对象,如农业机械、设施、土壤和作物。通过无线通信技术链接到互联网,通过传感器收集和捕获的数据(如温度和湿度、光度、二氧化碳、土壤湿度、害虫等)上传到云数据库。通过物联网系统,不仅可以收集消费者需求和商业信息,还可以基于大数据进一步探索、组织和分析。处理后的数据可以转换为农业运营的有用信息,以帮助农场经理实施生产和营销规划、生产管理和客户服务。通过智能监控,可以促进生产和营销过程,减少农场运营的冗余程序,减少劳动力,从而建立更高效的农场管理模式。
本研究中分析的害虫是荔枝蝽(Tessaratoma papillosa),它是分类学上属于节肢动物昆虫纲的半翅目昆虫科中的一种昆虫。气味腺是臭虫的重要特征之一。荔枝臭虫主要分布在南亚和东南亚,主要以荔枝和龙眼树为食。它们是破坏性害虫,通常造成种植园果树20%~30%的损失,在最坏的情况下甚至导致产量下降90%。这些臭虫还生活在路边的树下,例如台湾的金雨树和西方的皂荚树,他们可能对路人构成风险,因为他们在收到威胁时往往会喷射出防御性化学物质。
有研究表明,荔枝臭虫产生的化学物质可能会对人体皮肤造成损害或过敏,如果被喷到眼睛,会导致1~2天暂时失明。因此,这些昆虫被视为有害昆虫,因为它们的防御行为会煽动公众。荔枝臭虫的成虫和若虫用刺鼻的吸吮口器从芽、嫩枝、花穗和小果中提取植物液体,导致花和未成熟果实脱落,嫩枝和小果枯萎,以及果皮上的黑色斑点。这些对果树的损害通常是作物产量低的原因。此外,刺穿引起的伤口部位容易感染霜霉病,并传播龙眼从枝病相关病毒(LWBD或LWBaV),这可能对花穗和果轴有害,并导致幼枝和幼果枯萎。其他损伤包括扭曲的树枝、卷曲的芽和导致生殖失败的话器官退化。
本研究将重点分析两种类型的农业数据集:环境数据和现场有害生物调查。由于农业中的环境数据是根据时间顺序出现的一系列数据点。通常,时间序列以规则的间隔时间(例如,1秒、5分钟、1小时、7天等)生成。因此,时间序列可以作为离散时间数据进行分析和处理。根据数据的变化,有规则和不规则时间序列主要分为以下四种模式:趋势性、周期性、随机性和综合性。
与卷积神经网络不同,递归神经网络主要关注动态时间行为。它关联长期时间数据,并使用其内部状态神经网络循环处理时间序列的输入。长短时记忆(LSTM)是一种特殊的时间递归神经网络(RNN),具有独特的机构和计算单元,适用于处理和预测时间序列中具有长间隔和延迟的事件。LSTM用于处理长时间序列计算中的消失和爆炸梯度问题。
在传统农业中,作物产量受天气影响很大。农民即使根据多年积累的耕作经验,也不可能预测未来几周的天气状况。因此,在过去,农业容易因为虫害、疾病和天气影响产量。近年来,预测数据在人工智能技术中的应用逐渐成熟。物联网在农业中的实施包括通过使用历史数据预测未来环境价值的LSTM网络。因此,可以以另一种形式保留农民过去的经验,以尽快改进害虫防治和生长管理程序,同时提高整体能力。
本研究通过物联网技术将自行设计的环境传感器设备均匀部署在果园中。太阳能用于实现环境价值的不间断收集。采集无线远程传输和云计算技术中的大数据处理,实现智能农业中的实时虫害控制。LSTM模型用于预测天气,而机器学习也用于识别害虫与环境因素之间的相关性。因此,农民可以获得农田的实时天气条件。可以通过历史数据预测未来的环境价值。虫害检测由专家进行,以找出气候变化与虫害之间的相关性,帮助农民在管理植物生长的同时采取预防措施和早期发现虫害。农田管理中的应用可以有效提高作物产量。
本文的结构如下:第二节介绍了文献和方法;第三节阐述了研究方法;第四节介绍了实验方法;第五节说明了研究方法的实验和验证结果;在第六节中,详细指出了研究的主要发现,同时提出了未来研究的局限性和建议。

2 相关工作

目前,用于识别物联网中病虫害的环境传感器和图像识别系统在智能农业中普遍使用。研究人员使用传感器记录植物生长的环境数据,并使用无人驾驶车辆收集不同阶段的作物图像。AIoT技术还用于分析与植物生理学、分类学中的植物物种、作物疾病监测和害虫防治相关的数据。在TN Balasooriya等人的研究中,作者指出,在当前用于农业的智能灌溉系统中,没有考虑灌溉水和土壤水分的pH值(氢功率)。然后提出了一种基于物联网的智能灌溉系统(IBSWS),以提高灌溉效率。该系统还可用于根据不同作物调整氢值功率,以解决传统农业的水浪费问题。
根据应用于智能农业环境监测系统的物联网方法、它主要由四个部分组成:物理结构、数据采集、数据处理和数据分析系统。

2.1 物理结构

物理结构用于检测环境中的事件或变化。该传感器可以同时采集多种环境参数和作物生长因子,如光亮度、大气压值、土壤水分和肥料参数。因此,传感器硬件的稳定性和抗干扰能力非常重要。因此,需要研究侧重于可靠的数据传输。Van Staden的论文讨论了不同等级传感器提供数据质量,并提出了传感器维护策略。特定等级的传感器可以满足系统的大部分需求。还对高质量和平均质量传感器提供的数据进行了分析和比较。用户可以根据本文分析的数据,决定是否愿意为传感器支付更多费用,以获得更高质量的数据。Okafor提出了网络架构和概念,例如建立准确的环境监测模型以实现稳定的结果,并通过建立模型使用监测系统收集的数据来完成缺失的数据。还提出了一种低成本传感器,可以提供高分辨率测量数据,以增强当前环境监测系统收集的现有数据的信息。然而,需要注意的是,LCS需要经常校准,以提供准确可靠的数据。

2.2 数据采集

数据采集系统包括物联网数据采集和数据传输模块。物联网数据采集模块通过提供设备和数据之间的兼容性来集成不同的硬件接口,并通过并行传输或串行传输根据适当的通信协议交换数据。为了实时监控,数据传输通常通过无线传输协议实现。根据数据传输距离,它可以分为短距离传输,如无线个人网络(如蓝牙低能量(BLE)、ZigBee)和长距离传输,如远程(LoRa)。在本研究中,设计了一个智能自动化控制系统,并通过LoRa在不同距离进行了测试。此外,本研究还开发了一种用于监测环境温度和湿度的应用程序,该应用程序克服了传统通信技术的局限性,成本低,精度高。

2.3 数据处理

根据数据类型,数据处理模块可以分为图像、视频和标量数据集。该模块与数据挖掘和数据加载系统集成。本节根据系统需求提供各种服务。在数据采集过程中,经常会遇到传感器损坏或数据丢失的问题。Gupta等人提出了一种用于在线错误监测的渐进本地化框架。该框架通过在线解决方案检测本地传感器提供的数据中的错误,并使用大数据工具处理这些问题。

2.4 数据分析

数据分析模块用于分析收集的农业数据。由于农田上的多组传感器连续收集农业数据,因此收集的环境数据量巨大。通过这种方式,可以精确地对这些事件序列数据进行环境天气预报,以预测未来可能的变化。在Donlapark Ponnoprat的研究中,提出了由两个LSTM自动编码器组成的模型,分别学习短时期动态和季节动态,以预测降雨周期。结果表明,LSTM模型优于其他深度学习模型。通过引入季节性自动编码器,可以改善预测值和实际值之间的相关性。
Song等人试图解决收集传感器数据过程中的数据丢失的问题。采用不同的方法来填充缺失的数据。研究发现,LSTM神经网络由于其独特的数据填充方法,在增强长期损失数据方面优于其他模型。在比较LSTM神经网络中不同环境参数得出的实验结果后,选择空气湿度、光合有效辐射和土壤湿度作为主要输入。结果表明,构造用于填充缺失数据的多维参数数据可以显著延长数据序列的长度,同时操持准确性并减少一维数据处理中出现的累计误差。
采取有效的防治措施是防治荔枝臭虫的关键。T、 Boopath等人提出用自回归综合移动平均(ARIMAX)模型建立网络模型,每周预测荔枝臭虫的发生,以最大限度地减少虫害的影响。然而,对于时间序列问题,大多使用回归模型。虽然回归模型在数据预测方面由很好的结果,但它需要为任务要求选择有效的回归分析。为了满足岛屿气候对害虫生长的影响,本研究使用LSTM预测作物的生长环境,并使用机器学习方法。由于特殊的存储结构,可以存储不同时间长度的数据,并可以获得更准确的预测结果。

3 方法

本节介绍了基于物联网的传输机制。环境时间序列数据通过长短记忆网络进行分析。随后对大量数据进行了进一步计算和分析。因此,我们在种植园部署了多个环境传感器设备,通过无线传输、云计算中的大数据处理和害虫预测人工智能的支持,对农业害虫进行实时管理。本文使用物联网技术为农名提供农田的实时气象条件,如大气温度、空气湿度、土壤湿度和阳光等。

3.1 远程无线功率传输技术

远程无线通信技术应用与通用分组无线业务/码多分址(GPRS/CDMA)、数字无线电、扩频微波、无线网桥和卫星通信、短波通信、LoRa低功率无线传输等。该技术主要用于偏远地区或无法正确接入电缆的地区,例如矿区、近海或受污染的场地。
本研究使用LoRa无线传输技术,为远程通信链路提供无线物理层,将数据转换为电磁波。长距离消息可以通过线性调频信号以较低的传输速率传输,以降低复杂性并增强消息的安全性和可靠性。
LoRa的网络架构采用星形拓扑结构,其中终端节点可以向多个网关发送消息。网关是边缘设备的终端节点和网络服务器之间的桥梁。网络服务器整合数据并上传到应用服务器,应用服务器是最终服务器。即使不部署网络,LoRa的传输距离也可以达到20公里。它的基站可以方便地设置。LoRa适用于不需要即时反馈的定期通信。
D.yim等人在树林中部署了LoRa无线传输,并对不同的传输协议进行了多参数调节,以观察其对传输距离和稳定性的影响。对森林中LoRa远距离传播的观察包括:1.传输距离越长,接受信号强度指标(RSSI)值越小;2.宽带(BW)对LoRa的影响可以忽略,但对RSSI的影响显著;3.扩展因子(SF)越高,LoRa的可靠性越好,通信距离越长。
此外,Kufakunesu和Chen还比较了各种传输协议,指出了每种传输协议的优缺点和适用的环境。

3.2 长短时记忆

Hochreiter和Schmidhuber提出了长短期记忆(LSTM),这是一种递归神经网络(RNN)模型。它主要克服了循环神经网络在训练过程中长时间序列引起的消失和爆发梯度问题的缺点。它由能够保留短时期和长期数据的智能网络单元组成。它主要通过存储单元存储数据,以学习时间序列数据的长期依赖性。公共LSTM单元包含输入门、输出门和忘记门。这三个门控制信息流,包括数据更新、数据输出和消除无关信息以控制数据交付。
LSTM模型有四个功能元素:“x”是阿达玛积,“+”是矩阵加大,“∑”和“tanh”是激活函数。计算过程分为三个阶段:遗忘、选择记忆和输出。在遗忘阶段,根据遗忘门决定保留或遗忘多少信息,有选择地记忆从前一个模块传入的数据。在选择存储器的阶段,输入门用于量化输入数据的重要性,并选择模型要记住的部分。在输出级,输出门根据当前期望确定与给定数据相关的数据。图1显示了长短时记忆(LSTM)单元。

LSTM模型通过特殊的存储方法和计算规则处理时间序列数据,在处理需要复杂计算的机器翻译、语音识别和异常数值诊断方面具有更好的性能。LSTM在预测股市价格和趋势或检测工业生产线中的异常方面具有良好的准确性。当应用于天气预报时,LSTM模型使用机器通过卫星和雷达学习环境传感数据,以获得更高的精度。计算这些长期时间序列数据以获得高精度的气象信息需要大量的训练时间和大数据分析工作。

4 实验

本节将说明研究架构和实验过程。实验地点位于坡地上的果园。植物种类包括龙眼、荔枝、香蕉和杨桃。针对荔枝臭虫的防治措施,本文旨在开发用于害虫监测和预测的物联网传感器。适合坡地的小气候监测站可以收集环境传感数据,并通过无线传输将数据从服务器上传到云数据库。我们与害虫调查专家合作,调查种植园害虫的当前发生情况。还详细记录了害虫的种群及其发生区域。通过收集的数据,我们可以分析环境阴虚与害虫严重程度的相关性。几种神经网络和机器学习方法用于模型训练,以识别可能影响害虫发生的环境因素。
使用两种LSTM模型进行环境数据分析。首先,训练一个模型来确定虫害程度及其相应的环境因素。基于LSTM模型,可以建立另一个模型来预测环境数据,该模型使用历史数据进行训练。该模型可以提供天气条件的短期预测,并集成先前训练的有害生物识别模型,以提高预测有害生物发生区域的准确性。预测流程图如图2所示。

4.1 部署小气候监测站

2020年7月10日,我们在台湾台南市南华区坡地上的一个种植园中部署了六套小气候监测站。小气候站设置在100至200厘米的高度,带有伸缩支架。天线和太阳能电池板放置在机架顶部,以确保无线传输和稳定的太阳能供电。光传感器位于传感器箱的顶部。外壳防水,防止雨水和湿气损坏传感器,确保数据正确性。小气候站的部署如图3所示。

我们将树莓派4与多个环境传感器结合,以捕捉湿度(℃)、湿度(%)、土壤湿度(%)、光强度(lux)和大气压力(Pa)。种植园中部署的小气候监测站可以通过LoRa无线传输技术将数据传输到云数据库进行计算。图4显示了微气候站内部的传感器配置和现场设置。

4.2 传感器盒内部硬件架构的内部设计

图5显示了种植园中部署的小气候站内环境传感器的配置。基于物联网技术,实验使用Arduino Nano作为小型嵌入式平台,集成了四种传感器:用于光的GY-30、用于土壤的YL-69、用于温度和湿度的DHT22和用于大气压的BMP180.收集了五个环境数据因子,包括温度、湿度、光照水平、土壤湿度和野外大气压力。

我们使用DS3231模块校准微处理器的时钟。Arduino Nano每小时接收一组环境数据,并通过LoRa传输模块将数据传输到Raspberry Pi 4服务器。Raspberry Pi 4服务器然后将数据上传到云数据库,以便通过无线网络进行存储。微控制器Arduino还将数据存储在传感器内的SD模块中,以防止发生传输故障时数据丢失。
微气候站中使用的无线传输模块是Grove LoRa无线电,带有收发器SX1276。由于LoRa的低功耗和高可靠性,数据可以从客户端无线传输到Raspberry Pi 4服务器,质量稳定。
从Raspberry Pi 4传输的云数据库中存储的环境数据允许开发人员实时监控环境变化,以用于信息检索和分析。为了在必要时在现场收集传感数据,部署的六套环境传感器都配备了LoRa无线传输模块。环境数据通过LoRa无线模块传输到Raspberry Pi 4服务器,然后上传到云数据库,为管理者提供即时查询功能和数据访问。服务器(Raspberry Pi 4)最多可以同时连接6组环境传感器。

4.3 LoRa传输机制试验

实验使用LoRa作为无线传输机制。LoRa的传输速率不同于4G网络技术。LoRa可以支持大规模数据的远程传输,而WIFI和蓝牙可以提供大量数据的短距离传输。由于LoRa技术具有低功耗要求和对少量数据进行远程通信的关键特征,因此通常将其作为远程机器对机器(M2M)传输的解决方案。它可以用于服务更大的覆盖范围,如城际物联网传输平台。在本实验中,使用树莓Pi 4和LoRa模块作为服务器平台,从现场放置的各种传感器接收环境数据。每个环境传感器箱配备一组LoRa传输模块。我们选择的LoRa传输模块是Grove LoRa Radio 868 MHz。使用SX1276 LoRa的RFM95芯片,最大功率达到20dbm。发射端和接收端配备了一个九dBi增益全向天线,以增强在海拔变化的坡地上种植园中的传输。
我们于2020年8月30日13:00在坡地龙眼种植园部署了本规范的太阳能小气候监测站。八个月后的2021年4月30日,该站的传感器仍在稳定持续地工作,以接收数据。图6显示了带有太阳能电池板和电源管理模块的微气候监测站的内部硬件配置。

4.4 害虫调查

荔枝臭虫产卵前应采取预防措施,有效控制其成虫种群。本研究于2020及2021在台湾台南市南华区坡地人工林进行有害生物种群监测。害虫调查专家选择了7-10棵龙眼树进行研究。在调查期间,所选树木未使用杀虫剂,以避免对实际成年种群造成影响。每周进行一次采样,以包括其生命周期的所有阶段,但产卵期除外。由于昆虫倾向于向温暖和阳光充足的地方移动,因此从树梢上分别采集了10-15根朝东、朝南、朝西和朝北的小枝进行实地调查。叶子背面的虫子数量会被计算出来。图7显示了受监测昆虫的不同阶段。调查专家将测量不同阶段所需的时间:产卵前标记1 30分钟,产卵后标记2个若虫,标记3个若虫,标记4个成虫。

4.5 修正环境传感数据并以图形方式显示数据

由于小气候监测站需要长时间放置在室外,可能会发生不可预测的因素导致数据异常。此外,在实时无线数据传输到服务器站的过程中,可能会出现数据包错误,导致接收到异常值。因此,我们提出了一种检查接收到的环境传感数据并进行数据校正的方法。图8为第一组小气候监测站提供的2020年11月29日至2021年3月5日未标定数据图。采样率图表中的每个传感器表示每小时的数据。从台南市南华区坡地种植园采集的数据,包括温度、湿度、光照和土壤湿度值。从图 8可以看出,在特定时间点的测量值异常。在图8(a)的温度数据中,有一个值超过了100摄氏度,这显然是需要校正的异常数据。在图8(b)所示的环境湿度值中,有几个数据值超过100,这是明显的异常,因为相对湿度单位是百分比,这意味着超过100的值是异常的,需要纠正。图 8© 显示土壤水分数据。由于土壤水分的单位是百分比,因此在以后的接收中需要进行修正,以保证数据的准确性。图8 ( d)表示光值,连续数个数据值为65535;但是,从实验结果来看,即使在最强的阳光下,光传感器也不可能检测到 65535 的值。因此,65535 被视为异常值,需要进行修正。

该研究采用移动平均线来检查每个数据中是否存在异常,并通过以下步骤纠正异常值:

  1. 环境传感数据是串行数据。假设第N个数据异常,检查N− 第1次和第N+1次数据,以查看是否存在异常。如果N− 1和N+1是精确的数据,N− th将取第1个值和第N+1个值的平均值,以替换第N个值。
  2. 如果N−1th也是异常值,继续向前搜索非异常值。确定的非异常值和第N+1th数据的平均值为第N个值。
  3. 如果第N+1个也是异常值,则继续向后搜索非异常值。将对第n个数据的前后非离群值进行平均,以替换第n个值。
  4. 如果第一个数据是异常值,则向后搜索非异常值以替换它。
  5. 如果最后一个数据是异常值,则向前搜索非异常值以替换它。

从图9可以看出,经过该方法校正后,环境感知序列中不再识别出异常值。该方法可用于校准环境传感数据,以便进一步分析和审查,以方便管理。校准后的环境传感数据可通过APP展示,为养殖场管理者提供对养殖场环境的及时掌控。图9 (a)为校正后的温度,图9 (b)为校正后的环境湿度,图9 ©为校正后的土壤湿度,图9 (d)为校正后的光照值。

4.6 预测害虫发生和爆发的方法

该研究将环境传感器的各种数据与荔枝蝽发生的现场调查相结合。传感器采集的环境参数(温度、湿度、光照强度和土壤湿度)作为模型的输入样本。LSTM网络模型用于执行环境数据生成。首先,必须确认输入参数。每小时生成一个多维环境数据。该方法使农民能够预测荔枝蝽的出现,并有足够的时间防止害虫的生长。同时,害虫调查员收集有关种群动态和气象数据的信息每周在现场。从被监测的系统中,在输入数据集的连续数据中,每周产生336个环境数据,而上述四个环境参数每小时记录一次。
本研究中用于预测害虫发生和爆发的方法是根据现实生活中的实际需求定制的方法。从害虫监测中获得的数据被转换为害虫侵扰的严重程度,以估计ML的准确性使用的型号。本周获得的与害虫种群相关的环境数据用于支持估计,系统将据此得出某些日期。如果在这些日期确实发生了虫害事件,则估计将被评估为准确。此外,利用ML模型识别与荔枝蝽发生相关的环境因素,并对农民需要注意的环境参数进行预警。当天气模式发生变化时,害虫的数量可能会增加。
Scikit-learn 包 促进了 ML 模型。Scikit-learn 是一个支持机器学习算法实现的开源 Python 库。NumPy和 SciPy是Python 的科学计算工具。随着 Python 的广泛使用,Scikit-learn 变得越来越流行。Scikit-learn 的特点是全面覆盖 ML 模型。还将比较K-最近邻 (KNN) 、支持向量机(SVM) 和随机森林的特征。

5 结果与讨论

5.1 使用 LSTM 进行缺失数据预测

本研究提出了一种环境数据的数据填充方法,以提高害虫预测分析的质量。预测模型包含三层LSTM和双向 LSTM 模型以保留时间序列特征。历史数据添加权重以进行有效传输。应首先确定出现缺失值的时间间隔。将利用数据缺失点之前过去两个月的有效历史数据来训练预测模型,以有效地提供可以填补缺失值的环境数据。
本实验将三层 LSTM 模型与双向 LSTM 模型进行比较。确定系数(R2)和均方误差(Mean-Square Error)用于评估不同序列持续时间的合理精度。在统计学中,决定系数是因变量的方差被自变量解释的比例。当其 R 平方接近 1 时,该模型几乎可以解释所有的变化。均方误差 (MSE) 指的是实际值与预期值之间的差值平方的平均值或平均值。MSE 值越小,预测模型分析实验数据的准确性越好。
三层LSTM模型参数为epoch=20,批量大小=128,优化器=adam,损失函数=MSE,激励函数=校正线性单元(ReLU)。三层LSTM模型的神经元数设置为256、128和64。单元按顺序减少,以避免由于历元数的增加而导致模型过度拟合。同时,在LSTM的第一层中添加衰减层,以减少过拟合。
双向LSTM模型的参数为epoch=20,batch_size=128,优化器=adam,损失函数=MSE,激励函数=ReLU。在双向LSTM模型中,向前和向后神经元的数量设置为256个单元。
本实验比较序列长度分别为6、12、24、72、168和336h的训练模型的差异,通过确定系数(R2)和均方误差(均方误差)观察适合模型的序列长度。表1显示,在使用三层LSTM和双向LSTM对不同序列长度进行训练后,计算确定系数和均方误差指数。结果表明,当三层LSTM的序列长度设置为72小时时,R2为0.969,MSE为0.908,在同一模型的不同序列参数下具有更好的性能。

由于该系统是在台湾训练的,因此获得的环境数据大多与海洋气候有关。据推断,在天气变化较大的地方,由于数据流是单向的,因此堆叠网络架构模型很难存储长数据。因此,如果序列长度为72小时,以72个数据为一组,在三天的训练中,我们可以期望更好的性能。
此外,当双向LSTM中的序列长度设置为336h时,R2为0.969,MSE为0.908,这是不同序列时间长度的更好评估指标。由于向前和向后的数据流,推测当前状态将与过去或未来的数据相关联。序列长度为336h,以适应大量数据,这意味着在2周内使用336个数据集进行预测,以获得更准确的数据。
数据丢失主要是由于传输过程中传感器和电源的不稳定造成的。因此,需要填充缺失的数据。在图10中,训练的双向LSTM模型用于补充缺失数据。图10(a)显示了缺失值的环境数据。图10(b)显示了长度为336的训练双向LSTM网络模型,用于预测缺失值,同时计算预测值和实际数据的准确性。

5.2 基于有害生物调查数据的预测结果

该研究使用了微气候监测系统从2020年11月29日至2021 6月30日收集的环境传感数据作为训练数据集。在田间荔枝臭虫种群动态调查中,害虫专家对害虫数据进行了标记。有害生物调查的数量转化为6个影响度,0∼5表示其严重性。由于有害生物调查数据每周进行一次,因此将环境数据量分为一周(336条记录),以监测有害生物种群。
基于不同的环境因素作为输入,实验中使用了三种机器学习模型(KNN、SVM、随机森林)。然后,预测模型预测环境因素与虫害程度之间的相关性。KNN模型参数为n_neighbors = 6, weights = ‘uniform’, algorithm = ‘auto’, metric = ‘minkowski’.。支持向量机模型参数为kernel = ‘rbf’, C = 1, gamma = ‘auto’。随机森林模型的参数为n_estimators = 10, criterion = ‘gini’, max_depth = none, min_samples_split = 1。
表2显示了用于预测有害生物发生和爆发的机器学习算法的准确性。ML模型的输入是一周的环境数据。准确率约为85%。虽然结果的准确性似乎令人满意,但预测中仍然存在误差。在未来的研究中,必须考虑不同时间模型性能的重要性以及RNN、LSTM和选通递归单元(GRU)在时间序列中的应用。应保留时间序列相关性,而不是使用机器学习方法来预测虫害的严重程度。

图11显示了使用不同环境因素(温度、湿度、光照强度和土壤湿度)估计害虫种群的结果。纵轴表示害虫数量,横轴表示连续数据的数量(天)。从图11中,我们可以看到个别环境因素对有害生物种群的影响。其中,在图11(d)中,土壤水分与害虫种群相对无关,而在图11(a、b、c)中,温度、湿度和光线对害虫种群有一定程度的影响。

根据害虫种群,害虫侵扰的严重程度为六度(从0∼5) 如图12所示。在研究中,根据不同的环境因素分别加权,通过计算和分析来估计害虫的数量。图12显示了有害生物发生程度的结果。

6 结论

本文提出了一种将物联网技术与长期和短期存储网络(LSTM)相结合的预测模型。它可以根据历史数据,包括气象因素和害虫调查,预测未来荔枝臭虫的发生和分布。帮助农民采取作物保护和虫害控制措施以防止产量受损至关重要。通过自行设计的物联网系统,将树莓Pi 4服务器和不同的环境传感器放置在农田中。数据通信通过低功耗、长距离无线传输进行。实验场地的环境传感数据传输至主服务器,数据上传至云数据库。有利于减轻农田巡查工作量,减少劳动力等资源。一方面,使用基于长期和短期记忆网络的环境传感数据不仅可以预测气象条件,而且可以填补历史数据的缺失值。另一方面,通过将环境数据与有害生物调查相结合,可以通过机器学习技术对系统进行训练,以预测环境因素(如温度、湿度和光照)与有害生物发病率之间的相关性。农民可以获得种植园和最常见虫害地区果树生长的实时信息,在这些地区,可以控制用于植物保护的无人机在疫区喷洒农药,并避开其他地点,以减轻过量农药造成的环境影响。这将大大减少农药的使用量,提高农民的效率,并促进水果生产。从而实现了农业的高科技智能化管理。
实验地点是亚热带坡地上的一个种植园。由于地形变化剧烈,种植园中有多种作物。该地区属于海洋性气候,季节变化明显。由于与其他天气条件稳定的地区相比,收集的环境数据波动更频繁,因此应特别注意实验中获得的数据的独特性。另一方面,害虫的调查数据也显示了一些影响。根据不同的采样标准,选择有代表性的树木进行目标害虫测量也有所不同。在不同位置进行的调查,如树梢、树叶的不同侧面或朝向不同的方向,会产生各种后果。建议在实验前确定收集环境数据集和进行有害生物调查的规则。为了获得一致的实验数据,必须通过相同的模型执行数据集收集规则,以建立用于未来训练的标准过程。此外,本研究使用机器学习模型对虫害的严重程度进行分类,并能够准确识别虫害种群动态与环境因素之间的相关性。由于预测时间延长,害虫发生率的错误预测仍然存在。值得注意的是,一年中的不同时间意味着害虫生命周期的不同阶段,在未来的研究中应予以考虑。应重视旨在解决时间序列任务的框架,如RNN、LSTM和门递归单元(GRU),以保持有害生物数据的时间依赖性,并促进机器学习在预测有害生物侵扰严重程度方面的应用。

Pest incidence forecasting based on Internet of Things and Long Short-Term Memory Network 论文精读相关推荐

  1. 【nature论文精读】Impedance-based forecasting of lithium-ion battery performance amid uneven usage

    [nature论文精读] Impedance-based forecasting of lithium-ion battery performance amid uneven usage 文章目录 [ ...

  2. GCN-LSTM预测道路交通车辆速度 英文 Vehicle Speed Forecasting Based On GCN-LSTM Combined Model

    GCN-LSTM模型预测道路交通车辆速度 GCN:又称GNN,图神经网络    LSTM:长短时记忆网络 Vehicle Speed Forecasting Based On GCN-LSTM Com ...

  3. 【论文精读】Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting

    [论文精读]Temporal Fusion Transformers for Interpretable Multi-horizon Time Series Forecasting 针对未来的一个多步 ...

  4. 【论文精读】AVP-Loc: Surround View Localization and Relocalization Based on HD VectorMap for AVP

    [论文精读]AVP-Loc: Surround View Localization and Relocalization Based on HD VectorMap for Automated Val ...

  5. 【论文精读】Local-Adaptive Image Alignment Based on Triangular Facet Approximation

    图像拼接系列相关论文精读 Seam Carving for Content-Aware Image Resizing As-Rigid-As-Possible Shape Manipulation A ...

  6. 2019_AAAI_Multi-Interactive Memory Network for Aspect Based Multimodal Sentiment Analysis

    Multi-Interactive Memory Network for Aspect Based Multimodal Sentiment Analysis 论文地址:https://ojs.aaa ...

  7. 【论文精读】Hybrid Bird‘s-Eye Edge Based Semantic Visual SLAM for Automated Valet Parking

    [论文精读]Hybrid Bird's-Eye Edge Based Semantic Visual SLAM for Automated Valet Parking 论文出处 ICRA2021 摘要 ...

  8. 【论文精读】Warping Residual Based Image Stitching for Large Parallax

    图像拼接系列相关论文精读 Seam Carving for Content-Aware Image Resizing As-Rigid-As-Possible Shape Manipulation A ...

  9. 愉快的学习就从翻译开始吧_0-Time Series Forecasting with the Long Short-Term Memory Network in Python

    The Long Short-Term Memory recurrent neural network has the promise of learning long sequences of ob ...

  10. Ground Segmentation based on Loopy Belief Propagation for Sparse 3D Point Clouds (论文速读)

    欢迎访问我的个人博客:zengzeyu.com Abstract 在使用3D激光雷达进行局部环境感知任务中,地面点分割是中重要的预处理任务,并且在起伏不平和倾斜的非结构化环境中非常具有挑战性.为了解决 ...

最新文章

  1. Linux下设置mysql和tomcat开机启动
  2. Ubuntu iso镜像文件写入U盘
  3. Neurala与CSDN宣布战略合作,将一站式AI平台BrainBuilder带给中国开发者
  4. ubuntu 安装yum_如何在 Linux 中安装微软的 .NET Core SDK | Linux 中国
  5. 多线程的基本概念 (什么是cpu)
  6. 【F3简介】一张图看懂FPGA-F3实例
  7. 前端学习(1556):ng-blnd指令
  8. [数据库字典]简单的3个SQL视图搞定所有SqlServer数据库字典
  9. find 命令_linux-find命令
  10. 衰减学习率真的有用吗?
  11. linux+udp数据传输,Linux利用socket实现两台pc之间的数据传输功能,包括windows到linux,UDP实现...
  12. 我的世界起床战争java 版服务器_我的世界中国版起床战争下载-我的世界中国版起床战争服务器_5577安卓网...
  13. win7(SP1 64位)升级IE浏览器升级到IE11
  14. clodop 打印插件打印不显示问题
  15. 服务器网站内容被阻止,关于安全狗提示“您请求的页面包含一些不合理的内容,已被网站管理员设置拦截”的解决方法...
  16. 【cocos精品】《梦幻西游》全面制霸苹果榜单 四榜登顶
  17. const定义及初始化约束
  18. MyBatis(一)MyBatis概述
  19. 泛函分析的几个空间和平行四边形法则
  20. VSCODE codeforces 插件

热门文章

  1. 已知ip地址如何算默认网关
  2. [转载]SAP报表开发工具——Report Painter
  3. android 微博开发者平台,微博Android平台SDK文档V.pdf
  4. android 电影放到哪个文件夹里,手机爱奇艺下载的电影保存到哪个文件夹里
  5. 67 Ways to Increase Conversion with Cognitive Biases
  6. 计算机不定时黑屏,宏基acer 4736ZG不定时黑屏,时亮时不亮通病维修
  7. Vue项目中Router路由中meta字段的妙用-案例
  8. 【windows7桌面图标蓝底】4步帮你去掉
  9. CollabNet Subversion Edge 版本库访问规则 svn
  10. 将图片(HDC)打印出来