遗传算法优化BP神经网络在非线性函数拟合中的应用

在工程应用中经常会遇到一些复杂的非线性系统,这些系统状态方程复杂,难以用数学方法精确建模。在这种情况下,可以建立BP神经网络表达这些非线性系统。通常BP神经网络的权值和阈值都是随机初始化的,这样容易导致拟合效果不稳定,况且由于使用梯度下降的方式训练BP网络的权值和阈值,容易导致训练陷入局部最优中,所以本案例我们通过遗传算法来对神经网络初始的权值和阈值进行优化。

本案例拟合的非线性函数为:

y=x12+x22y= x_{1}^{2}+x_{2}^{2} y=x12​+x22​

该函数的图形,如下图所示。

一、模型建立

1.1 整体算法流程

遗传算法优化BP神经网络算法流程如下图所示,分为BP神经网络结构确定、遗传算法优化和BP神经网络预测3个部分。

(1)BP神经网络结构确定部分:根据拟合函数输入输出参数个数确定BP神经网络结构,进而确定遗传算法个体长度。

(2)遗传算法优化部分:使用遗传算法优化BP神经网络的权值和阈值,种群中的每个个体都包含了一个网络所有权值和阈值,个体通过适应度函数计算个体适应度值,遗传算法通过选择、交叉和变异操作找到最优适应度值对应个体。

(3)BP神经网络预测部分:用遗传算法得到最优个体对网络初始权值和阈值赋值,网络经训练后预测函数输出。

本案例中,由于拟合非线性函数有2个输入参数、1个输出参数,所以设置的BP神经网络结构为2-5-1,即输入层有2个结点,中间层有5个结点,输出层有1个结点,共有2×5+5×1=152\times 5+5\times 1=152×5+5×1=15个权值,5+1=6个阈值,所以遗传算法个体编码长度为15+6=21。从非线性函数中随机得到2000组输入输出数据,从中随机选择1900组作为训练数据,用于网络训练,100组作为测试数据。把训练数据预测误差绝对值和作为个体适应度,个体适应度值越小,该个体越优。

1.2 遗传算法实现

遗传算法优化BP神经网络的要素包括种群初始化、适应度函数、选择操作、交叉操作和变异操作。

1. 种群初始化

个体编码方法为实数编码,每个个体均为一个实数串,由输入层与中间层连接权值、中间层阈值、中间层与输出层连接权值以及输出层阈值4部分组成。个体包含了神经网络全部权值和阈值,在网络结构已知的情况下,就可以构成一个结构、权值、阈值确定的神经网络。

2、适应度函数

根据个体得到BP神经网络的初始权值和阈值,用训练数据训练BP神经网络后预测系统输出,把预测输出和期望输出之间的误差绝对值之和EEE作为个体适应度值FFF,计算公式为:

F=k×∑i=1nabs(yi−oi)F = k\times\sum_{i=1}^{n}{abs(y_i-o_i)} F=k×i=1∑n​abs(yi​−oi​)

式中,nnn为网络输出结点数;yiy_iyi​为BP神经网络第iii个结点的期望输出;oio_ioi​为第iii个结点的预测输出;kkk为系数,本案例k=1k=1k=1。

3、选择操作

遗传算法选择操作有轮盘赌法、竞标赛法等多种方法,本案例选择轮盘赌法,即基于适应度比例的选择策略,每个个体iii的选择概率pip_ipi​为:

fi=kFif_i=\frac{k}{F_i} fi​=Fi​k​

pi=fi∑j=1Nfjp_i=\frac{f_i}{\sum_{j=1}^{N}{f_j}} pi​=∑j=1N​fj​fi​​

式中,FiF_iFi​为个体iii的适应度值,由于适应度越小越好,所以在个体选择前对适应度值求倒数;kkk为系数,本案例k=10k=10k=10;NNN为种群个体数目。

4、交叉操作

由于个体采用实数编码,所以交叉操作方法采用实数交叉法,第kkk个染色体aka_kak​和第lll个染色体ala_lal​在jjj位的交叉操作方法如下:

{akj=akj(1−b)+aljbalj=alj(1−b)+akjb\left \{ \begin{array}{c} a_{kj}=a_{kj}(1-b) + a_{lj}b \\ a_{lj}=a_{lj}(1-b) + a_{kj}b \\ \end{array} \right. {akj​=akj​(1−b)+alj​balj​=alj​(1−b)+akj​b​

式中,bbb是[0,1][0,1][0,1]间的随机数。

5、变异操作

选取第iii个个体的第jjj个基因aija_{ij}aij​进行变异,变异操作方法如下:

aij={aij+(amax−aij)×f(g),r>0.5aij−(aij−amin)×f(g),r≤0.5a_{ij}=\left \{ \begin{array}{c} a_{ij} + (a_{max} - a_{ij})\times f(g), r>0.5 \\ a_{ij} - (a_{ij} - a_{min})\times f(g), r\leq 0.5\\ \end{array} \right. aij​={aij​+(amax​−aij​)×f(g),r>0.5aij​−(aij​−amin​)×f(g),r≤0.5​

f(g)=r′(1−gGmax)2f(g) = r'(1-\frac{g}{G_{max}})^2 f(g)=r′(1−Gmax​g​)2

式中,amaxa_{max}amax​为基因aija_{ij}aij​的上界;amina_{min}amin​为基因aija_{ij}aij​的下界;ggg为当前迭代次数;GmaxG_{max}Gmax​为最大进化次数;r,r′r,r'r,r′为[0,1][0,1][0,1]间的随机数。

二、MatLab实现

2.1 染色体编码

function ret=Code(lenchrom,bound)
% 本函数将变量编码成染色体,用于随机初始化一个种群
% lenchrom   input : 染色体长度
% bound      input : 变量的取值范围
% ret        output: 染色体的编码值pick=rand(1,length(lenchrom));%线性插值,编码结果以实数向量存入ret中ret=bound(:,1)'+(bound(:,2)-bound(:,1))'.*pick;
end

2.2 适应度函数

function error = fun(x,inputnum,hiddennum,outputnum,net,inputn,outputn)
%该函数用来计算适应度值
%x          input     个体
%inputnum   input     输入层节点数
%outputnum  input     隐含层节点数
%net        input     网络
%inputn     input     训练输入数据
%outputn    input     训练输出数据
%error      output    个体适应度值%提取w1=x(1:inputnum*hiddennum);B1=x(inputnum*hiddennum+1:inputnum*hiddennum+hiddennum);w2=x(inputnum*hiddennum+hiddennum+1:...inputnum*hiddennum+hiddennum+hiddennum*outputnum);B2=x(inputnum*hiddennum+hiddennum+hiddennum*outputnum+1:...inputnum*hiddennum+hiddennum+hiddennum*outputnum+outputnum);%网络进化参数net.trainParam.epochs=20; % 最大迭代次数net.trainParam.lr=0.05; % 学习率net.trainParam.goal=0.00001; % 神经网络训练的目标误差net.trainParam.showWindow=false;%网络权值赋值net.iw{1,1}=reshape(w1,hiddennum,inputnum); % 输入层到中间层的权值net.lw{2,1}=reshape(w2,outputnum,hiddennum);  % 中间层到输出层的权值net.b{1}=reshape(B1,hiddennum,1); % 中间各层神经元阈值net.b{2}=B2; % 输出层各神经元阈值%网络训练net=train(net,inputn,outputn);an=sim(net,inputn);error=sum(abs(an-outputn));
end

注:

先假设神经网络结构,{ 9 [80 50 20] 1 }9为输入层,[80 50 20]为隐层,1为输出层。

  • net.iw{1,1} 表示 输入层 到 第1层隐层 的权重,为80*9的矩阵;
  • net.lw{2,1} 表示 第1层隐层 到 第2层隐层 的权重,为50*80的矩阵;
  • net.lw{3,2} 表示 第2层隐层 到 第3层隐层 的权重,为20*50的矩阵;
  • net.lw{4,3} 表示 第3层隐层 到 输出层 的权重,为1*20的矩阵;
  • net.b{1} 表示 第1层隐层 的偏置,为80*1的矩阵;
  • net.b{2} 表示 第2层隐层 的偏置,为50*1的矩阵;
  • net.b{3} 表示 第3层隐层 的偏置,为20*1的矩阵;
  • net.b{4} 表示 输出层 的偏置,为1*1的矩阵;

2.3 选择操作

function ret=Select(individuals,sizepop)
% 该函数用于进行选择操作
% individuals input    种群信息
% sizepop     input    种群规模
% ret         output   选择后的新种群%求适应度值倒数   fitness1=10./individuals.fitness; %individuals.fitness为个体适应度值%个体选择概率sumfitness=sum(fitness1);sumf=fitness1./sumfitness;%采用轮盘赌法选择新个体index=zeros(1,sizepop); for i=1:sizepop   %sizepop为种群数pick=rand;while pick==0    pick=rand;        endfor j=1:sizepop    pick=pick-sumf(j);        if pick<0        index(i)=j;            break;  endendend%新种群%individuals.chrom为种群中个体individuals.chrom=individuals.chrom(index,:);   individuals.fitness=individuals.fitness(index);ret=individuals;
end

2.4 交叉操作

function ret=Cross(pcross,lenchrom,chrom,sizepop)
%本函数完成交叉操作,点交叉
% pcorss                input  : 交叉概率
% lenchrom              input  : 染色体的长度
% chrom                 input  : 染色体群
% sizepop               input  : 种群规模
% ret                   output : 交叉后的染色体%每一轮for循环中,可能会进行一次交叉操作,%染色体是随机选择的,交叉位置也是随机选择的,%但该轮for循环中是否进行交叉操作则由交叉概率决定(continue控制)for i=1:sizepop % 随机选择两个染色体进行交叉pick=rand(1,2);while prod(pick)==0%prod函数为数组各元素乘积pick=rand(1,2);endindex=ceil(pick.*sizepop);% 交叉概率决定是否进行交叉pick=rand;while pick==0pick=rand;endif pick>pcrosscontinue;end% 随机选择交叉位pick=rand;while pick==0pick=rand;end%随机选择进行交叉的位置,即选择第几个变量进行交叉,%注意:两个染色体交叉的位置相同pos=ceil(pick.*sum(lenchrom)); pick=rand; %交叉开始v1=chrom(index(1),pos);v2=chrom(index(2),pos);%在v1与v2之间生成一个数,所以无须担心不符合约束条件chrom(index(1),pos)=pick*v2+(1-pick)*v1;chrom(index(2),pos)=pick*v1+(1-pick)*v2; %交叉结束   endret=chrom;
end

2.5 变异操作

function ret=Mutation(pmutation,lenchrom,chrom,sizepop,num,maxgen,bound)
% 本函数完成变异操作
% pcorss                input  : 变异概率
% lenchrom              input  : 染色体长度
% chrom                 input  : 染色体群
% sizepop               input  : 种群规模
% opts                  input  : 变异方法的选择
% num                   input  : 当前迭代次数
% maxgen                input  : 最大迭代次数
% ret                   output : 变异后的染色体
for i=1:sizepop   %每一轮for循环中,可能会进行一次变异操作,%染色体是随机选择的,变异位置也是随机选择的,%但该轮for循环中是否进行变异操作则由变异概率决定(continue控制)% 随机选择一个染色体进行变异pick=rand;while pick==0pick=rand;endindex=ceil(pick*sizepop);% 变异概率决定该轮循环是否进行变异pick=rand;if pick>pmutationcontinue;end% 变异位置pick=rand;while pick==0pick=rand;endpos=ceil(pick*sum(lenchrom));  %随机选择了染色体变异的位置,%即选择了第pos个变量进行变异pick=rand; %变异开始fg = rand*(1-num/maxgen)^2;if pick>0.5chrom(index,pos)=chrom(index,pos)+...(bound(pos,2)-chrom(index,pos))*fg;elsechrom(index,pos)=chrom(index,pos)-...(chrom(index,pos)-bound(pos,1))*fg;end   %变异结束
end
ret=chrom;

2.6 遗传算法主函数

遗传算法主函数流程为:

  • 步骤1:随机初始化种群;
  • 步骤2:计算种群适应度值,从中找出最优个体;
  • 步骤3:选择操作;
  • 步骤4:交叉操作;
  • 步骤5:变异操作;
  • 步骤6:判断进化是否结束,若否,则返回步骤2;
% 清空环境变量
clc
clear%% 读取数据
% input:2000*2,output:2000*1
load data.mat input output% 训练数据和预测数据
input_train = input(1:1900,:)';
input_test = input(1901:2000,:)';
output_train = output(1:1900)';
output_test = output(1901:2000)';% 选择样本输入输出数据归一化
[inputn,inputps] = mapminmax(input_train);
[outputn,outputps] = mapminmax(output_train);%% 网络结构建立
% 节点个数
inputnum = 2;
hiddennum = 5;
outputnum = 1;
% 构建网络
net=newff(inputn,outputn,hiddennum);%% 遗传算法参数初始化
maxgen = 50;                        %进化代数,即迭代次数
sizepop = 10;                       %种群规模
pcross = 0.4;                       %交叉概率选择,0和1之间
pmutation = 0.2;                    %变异概率选择,0和1之间
% 节点总数
numsum = inputnum * hiddennum + hiddennum + hiddennum * outputnum+outputnum;
lenchrom = ones(1,numsum);
bound=[-3*ones(numsum,1) 3*ones(numsum,1)];    %数据范围%% 种群初始化
% 将种群信息定义为一个结构体
individuals=struct('fitness',zeros(1,sizepop), 'chrom',[]);
%初始化种群
for i=1:sizepop%随机产生一个种群individuals.chrom(i,:)=Code(lenchrom,bound); %编码结果为一个实数向量x=individuals.chrom(i,:);%计算适应度individuals.fitness(i)=fun(x,inputnum,hiddennum,...outputnum,net,inputn,outputn);   %染色体的适应度
end%找最好的染色体
[bestfitness,bestindex]=min(individuals.fitness); %每一代种群的最佳适应度
bestchrom=individuals.chrom(bestindex,:); %适应度最好的染色体
avgfitness=sum(individuals.fitness)/sizepop; %每一代种群的平均适应度
% 记录每一代进化中最好的适应度和平均适应度
trace=ones(maxgen+1,2);
trace(1,:)=[avgfitness bestfitness];%% 迭代求解最佳初始阀值和权值
% 进化开始
for i=1:maxgendisp(['遗传算法第',num2str(i),'代:'])% 选择individuals=Select(individuals,sizepop);% 交叉individuals.chrom=Cross(pcross,lenchrom,individuals.chrom,sizepop);% 变异individuals.chrom=Mutation(pmutation,lenchrom,individuals.chrom,...sizepop,i,maxgen,bound);% 计算适应度for j=1:sizepopx=individuals.chrom(j,:);individuals.fitness(j)=fun(x,inputnum,hiddennum,outputnum,net,...inputn,outputn);end%找到最小和最大适应度的染色体及它们在种群中的位置[newbestfitness,newbestindex]=min(individuals.fitness);[worestfitness,worestindex]=max(individuals.fitness);% 代替上一次进化中最好的染色体if bestfitness>newbestfitnessbestfitness=newbestfitness;bestchrom=individuals.chrom(newbestindex,:);endindividuals.chrom(worestindex,:)=bestchrom;individuals.fitness(worestindex)=bestfitness;avgfitness=sum(individuals.fitness)/sizepop;%记录每一代进化中最好的适应度和平均适应度trace(i+1,:)=[avgfitness bestfitness];disp(['最佳适应度',num2str(bestfitness)])
end% 遗传算法结果分析
figure(1)
plot(trace(:,1),'b--');
hold on
plot(trace(:,2),'r--');
title(['适应度曲线  ' '终止代数=' num2str(maxgen)]);
xlabel('进化代数');ylabel('适应度');
legend('平均适应度','最佳适应度');
disp('遗传算法优化后的网络权值阈值');
x=bestchrom;
disp(x);

% 把最优初始阀值权值赋予网络预测
%用遗传算法优化的BP网络进行值预测
w1=x(1:inputnum*hiddennum);
B1=x(inputnum*hiddennum+1:inputnum*hiddennum+hiddennum);
w2=x(inputnum*hiddennum+hiddennum+1:inputnum*hiddennum+...hiddennum+hiddennum*outputnum);
B2=x(inputnum*hiddennum+hiddennum+hiddennum*outputnum+...1:inputnum*hiddennum+hiddennum+hiddennum*outputnum+outputnum);
net.iw{1,1}=reshape(w1,hiddennum,inputnum);
net.lw{2,1}=reshape(w2,outputnum,hiddennum);
net.b{1}=reshape(B1,hiddennum,1);
net.b{2}=B2;
% BP网络训练
% 网络进化参数
net.trainParam.epochs=100;
net.trainParam.lr=0.05;
net.trainParam.goal=0.000001;
%网络训练
net=train(net,inputn,outputn);

% BP网络预测
% 数据归一化
inputn_test=mapminmax('apply',input_test,inputps);
an=sim(net,inputn_test);
test_simu=mapminmax('reverse',an,outputps);
error=test_simu-output_test;
figure(2)
plot(test_simu,':og')
hold on
plot(output_test,'-*');
legend('预测输出','期望输出')
title('BP网络预测输出','fontsize',12)
ylabel('函数输出','fontsize',12)
xlabel('样本','fontsize',12)

figure(3)
plot(error,'-*')
title('BP网络预测误差 ','fontsize',12)
ylabel('误差','fontsize',12)
xlabel('样本','fontsize',12)

figure(4)
plot((output_test-test_simu)./test_simu,'-*');
title('神经网络预测误差百分比')
errorsum=sum(abs(error));
disp(['总体误差为:',num2str(errorsum)]);

三、结果分析

遗传算法优化BP神经网络过程中平均适应度与最优个体适应度值变化如图3所示。

遗传算法优化得到的BP神经网络最优初始权值和阈值如下表1所列。

表1 最优初始权值阈值

属性 向量
输入层隐含层间权值 0.4315,2.6971,-1.8066,-2.4710,0.6966,0.0125,-1.7951,-2.0182,-2.5766,-2.1384
隐含层节点阈值 2.7510,0.6041,-1.4095,0.1721,-2.7112
隐含层输出层间权值 0.5404,-2.7593,-0.6510,1.9226,0.8620
输出层节点阈值 -0.3504

把最优初始权值和阈值赋给神经网络,用训练数据训练100次后预测非线性函数输出,预测误差如图6、7所示。从对比数据见表2,可以看出遗传算法优化的BP神经网络预测更加精确。

表2 不同方法对比

优化方法 迭代次数 总体误差
单隐含层BP神经网络 100 9.1493
多隐含层BP神经网络 100 2.2148
GA优化 BP神经网络 10 1.9824

可见,遗传算法优化BP神经网络是对普通BP神经网络的一种优化方法,如果把BP神经网络看成是一个预测函数,遗传算法优化BP神经网络相当于优化预测函数中的参数,优化后BP神经网络的预测效果一般优于未优化的BP网络。但是该算法是有局限性的,它只能有限提高原有BP神经网络的预测精度,并不能把预测误差较大的BP神经网络优化为能够准确预测的BP神经网络。尤其对一些因为样本数量少、样本分布不均匀而造成神经网络预测误差大的问题,优化后的网络预测能力一般不能得到明显提高。

四、练习

(1)拟合的非线性函数:

f(x,y)=sin⁡xx×sin⁡yy,x,y∈[−10,10]f(x,y) = \frac{ \sin x}{x}\times \frac{\sin y}{y},x,y\in[-10,10] f(x,y)=xsinx​×ysiny​,x,y∈[−10,10]

该函数的图形,如下图所示。

[x_plot,y_plot] = meshgrid(-10:0.05:10);
z = (sin(x_plot)./x_plot).*(sin(y_plot)./y_plot);
mesh(x_plot,y_plot,z)
xlabel('第一维度x的取值范围');
ylabel('第二维度y的取值范围');
zlabel('函数值');

遗传算法优化BP神经网络在非线性函数拟合中的应用相关推荐

  1. 基于Matlab的遗传算法优化BP神经网络在非线性函数拟合中的应用

    本微信图文详细介绍了遗传算法优化BP神经网络初始权值阈值的过程,并通过实例说明该优化能够提升BP神经网络的预测精确程度.

  2. 基于Matlab的多层BP神经网络在非线性函数拟合中的应用

    本图文详细介绍了如何利用Matlab神经网络工具箱实现多层BP神经网络对非线性函数的拟合.

  3. 基于Matlab的BP神经网络在非线性函数拟合中的应用

    本图文详细介绍了如何利用Matlab神经网络工具箱实现BP神经网络对非线性函数的拟合.

  4. 基于BP神经网络的非线性函数拟合(一维高斯函数)研究-含Matlab代码

    目录 一.引言 二.BP神经网络的结构与原理 2.1 信息前向传播 2.2 误差的反向传播过程 三.基于BP神经网络的非线性函数拟合 3.1 数据生成 3.2 神经网络拟合结果 四.参考文献 五.Ma ...

  5. 【智能控制实验】基于MATLAB的BP神经网络实现非线性函数拟合设计

    基于MATLAB的BP神经网络实现非线性函数拟合设计 一.实验要求: 重点是掌握BP神经网络的学习算法原理,掌握matlab工具箱设计BP神经网络拟合非线性模型的方法(m文件):掌握在图形用户界面下设 ...

  6. 基于遗传算法优化的BP神经网络的 非线性函数拟合

    遗传算法 ( GA , Genetic Algorithm ) ,也称进化算法 . 遗传算法是受达尔文的进化论的启发,借鉴生物进化过程而提出的一种启发式搜索算法.因此在介绍遗传算法前有必要简单的介绍生 ...

  7. BP神经网络的非线性函数拟合

    BP神经网络主要用到newff,sim 和train3个神经网络函数,各函数解释如下. 1.newff:BP神经网络参数设置函数 函数功能:构建一个BP神经网络. 函数形式:net= newff(P, ...

  8. 《MATLAB 神经网络43个案例分析》:第3章 遗传算法优化BP神经网络——非线性函数拟合

    <MATLAB 神经网络43个案例分析>:第3章 遗传算法优化BP神经网络--非线性函数拟合 1. 前言 2. MATLAB 仿真示例 3. 小结 1. 前言 <MATLAB 神经网 ...

  9. 遗传算法优化BP神经网络

    遗传算法原理 遗传算法背景不作介绍.遗传算法作为一种并行随机搜索最优化算法,将自然界的优胜劣汰的生物进化原理引入优化参数形成的编码串联群体中,按照所选的适应度函数并通过遗传中的选择,交叉和变异对个体进 ...

最新文章

  1. C 语言 cgi 程序简单总结
  2. php 清除数据表中所有数据库,清除一个数据库里所有表的数据
  3. EXCEL基本操作(一~二)
  4. CSS问题的撰写准则
  5. Go的GAPATH详解
  6. php composer使用过程
  7. 一个下载游戏封面的站点
  8. 斗鱼赴美递交IPO招股书:拟登陆纽交所 融资5亿美金
  9. Linux系统管理-(12)-网络配置IP命令
  10. 文本输入框input将输入转换为统一大小写
  11. 关于三个概念:ActiveX、OLE和COM
  12. centos7的php5.4竟然不支持原生的mysql
  13. 5.Jenkins 权威指南 --- 安全
  14. 重写对象的equals和hashCode方法
  15. 产品技术人必备干货:产品开发流程(完整版)
  16. excel 转txt文件
  17. 使用espressos idlingresource获得最高的Android测试速度
  18. TCP协议的三次握手大体流程
  19. 小程序weui组件使用
  20. 电信增值业务学习笔记13——增值业务管理

热门文章

  1. 网络分布式文件系统-MFS搭建以及部署详解
  2. API 每日一图API
  3. 从零开始搭建python flask+vue 小型web项目以及flask_sqlalchemy访问数据库
  4. 合同比对系统,告别人工比对,差异比对率100
  5. 使用该设备需要WIA驱动程序
  6. StarUML用户手册
  7. 四、字符编码:ascii、gbk、Unicode、utf-8
  8. leetcode报错:member access within null pointer of type struct ListNode
  9. 【图像几何】基于傅里叶+DCT图像变换matlab代码
  10. python大数据好不好学_大数据好学吗?想转行大数据??