《基于RBF网络的北方温室环境控制机理的研究》:第三章温室环境RBF网络模型

 

------第三章温室环境RBF网络模型------



第一节引言

由于温室是一个典型的非线性、大惯性、强耦合和时变的复杂被控对象,温室内部作物的生理特征的变化、所采取的各种调控措施以及外界气候变化都会对温室环境产生影响,因此,它的模型很难通过机理法用简单的数学公式或传递函数来描述,用统计建模的方法主要有最小二乘法、最大似然法等,但这些方法计算繁琐、计算量大。

人工神经网络建模方法具有强大的非线性函数映射能力,在理论上适用于所有的生产过程系统。对于不同的过程系统或操作条件,只要取得足够的样本数据,便可建立相应的神经网络模型,并且具有自组织、自学习、自适应能力,能够根据环境条件的变化或人为的学习来自行调节权值,使网络的行为适用于规定的任务,而且求解速度快,操作条件可以按需要随时改变,还可以预测操作的结果,优化生产条件,提高生产率。因此,本文选择通过神经网络建模法来建立温室环境温、湿度模型,能更好地接近温室环境变化,全面地反映温室系统的非线性特性。

各地温室所处地理位置的不同,其环境条件也不相同,我国北方温室环境不同于南方温室,北方夏季炎热、干燥,冬季寒冷、潮湿,春、秋季早晚温差大,每个季节有不同的特点,难以用一个模型描述其特性,因此,这里将根据北方温室春季环境数据,利用RBF网络建立北方温室春季环境模型,为夏季和冬季模型的建立做基础,并为北方温室的结构设计、控制方案制定提供重要依据。

第二节试验数据的采集与处理

试验数据来源于黑龙江省哈尔滨市农科院园艺分院花卉温室,温室位于北纬45°45,东经126°41,该温室是由北京京鹏环球科技股份有限公司承建的智能型节能日光温室,温室结构参数及内部设备参数见表3-1,温室总轴线面积为7000m2,内部设有自然通风系统、内遮阳系统、外保温系统、湿帘降温系统、热水加温系统、滴灌控制系统、CO2增施系统和补光系统等,电气及计算机控制系统由以色列Eldar公司提供。每个温室为四连栋锯齿形PVC板温室,顶高5.2m,天沟高3m,每跨安装一个天窗,开度45°,外设保温幕,温室内2m高处设有两组4台交错安装的除湿风机,每组间距12m,同向两台风机间距8m,风机功率为550W,全压149Pa,风量8870m3/h,转速1450r/min,遮阳网高2.5m,共8个,幅宽4m,遮阳网电机功率550W,温室南端设有8个轴流风机,北侧为湿帘。

数据采集时间在2007年3月31日零点到4月4日零点之间,以1200m2的蝴蝶兰温室为采样对象,采样周期为10min,采集室内温度、湿度、顶窗开度、保温幕展开度、遮阳网展开度、加热阀开度以及室外温度、照度、风速等720组数据,原始数据见附录中表1~5,表中遮阳网和保温幕的开度0为收拢,1为展开,加热阀和天窗开度为当前开度与最大开度的百分比,其他数据如湿帘状态,因未动作而不予考虑,而二氧化碳浓度等因对室内温度及湿度的影响小而忽略。由于空气相对湿度为[0,1]的小数,为尽量减小归一化对测量数据的破坏,空气相对湿度用0~1的小数表示,不参加归一化。其他所有数据按下式进行归一化处理:

第三节温室环境的RBF网络模型

根据温室春季环境的特点,确定输入量如下:温室外的温度和风速,温室内的光照,顶窗开度,保温幕展开度,遮阳网展开度,加热阀开度等7个量,输出量为温室内的温度和湿度。

网络模型性能以温度和湿度测试误差的平均误差ME、均方根误差RMSE、误差范围、隐节点数和模型有效性EF等为指标,来衡量模型的泛化能力和精度。平均误差ME表示为

式中,为网络模型输出,为实际测量输出,为实际测量输出的平均值,N为样本数。其中,隐节点数表明网络结构的复杂程度,误差范围表明了网络输出与实际输出的偏差范围,平均误差ME反映了模型输出结果偏离真实值的程度,均方根误差RMSE反映了模型输出曲线在实际曲线上的波动情况,模型效率EF反映了模型输出与测量值的偏差相对于测量数据的离散性,性能良好的模型的EF值为1。

文[27]采用BPNN网络建立了温室内的温度、湿度和光照强度的模型,输入为地温、管道温度、室内温度和相对湿度等12个输入,隐节点数采用经验公式计算,式中I为输入节点数,O为输出节点数,确定隐节点数为6,采用带动量因子的BP算法训练网络,学习率0.3,动量因子0.4,训练步数500,以平均误差ME、均方根误差RMSE和模型效率EF等来衡量模型的泛化能力。本文以所建立的北方温室环境模型与文[27]的BPNN模型在平均误差ME、均方根误差RMSE、误差范围、隐节点数和模型效率EF等性能指标上进行对比分析。

一、基于OLS算法的温室环境RBF网络模型

OLS算法由于其具有运算速度快、能得到较小的网络结构,而得到广泛应用。本节将介绍由基于OLS算法的RBF网络构成的温室温、湿度模型的训练方法及泛化结果。

720组输入、输出数据经过式(3-1)归一化处理后(湿度不参加归一化处理),其中前432组数据作为训练数据集,后288组数据作为测试数据集,表3-2中的数据为从288组测试数据中随机抽取的一部分归一化后的测试数据,全部测试数据见附表4~5。径向基函数采用高斯函数

式中,t为高斯函数的中心,即隐节点中心,σ为函数的方差或扩展常数。径向基函数的扩展常数采用试错法,经过多次实验确定为0.84,目标函数采用均方差判据,

式中,dk(n)为样本输出,yk(n)为网络输出,ek(n)为误差信号。隐中心将利用Gram-Schmidt正交化算法从输入数据中选择,输出层为线性输出,输出权值采用最小二乘法计算得到,

二、基于ES算法的温室环境RBF网络模型

对于给定的一组样本,RBF网络要解决的问题是:隐节点数、基函数的中心及扩展常数的值、计算输出权值。由于RBF网络的输出是线性输出方程,所以,在隐节点数、中心和扩展常数确定的情况下,输出权值可以用最小二乘法求解。OLS算法在设计、训练RBF网络时,从训练样本输入中选择中心,扩展常数通常取固定值,输出权值采用最小二乘法求解。在OLS算法中,使用了Gram-Schmidt正交化的方法,从隐输出阵中选择合适的列,确定隐节点中心,但是,隐输出的列向量并不是正交的,它们对输出的能量贡献也相互影响,尽管OLS算法在每一步都试图找到最大能量贡献的基矢量,并且能够找到较少个数的基矢量,构建较优的网络结构,但是,不能保证找到最少个数的基矢量,也就不能构建最简的网络结构。

选择最优的隐输出的列是组合优化问题,OLS算法只是采用最大投影法则的启发式算法,如果改变正交化次序,每个数据中心的能量贡献将发生变化,因此,OLS算法不能保证找到最优的列。而神经网络的逼近误差只与选择哪些数据中心有关,与这些数据中心被选中的次序无关[120]。由于RBF网络的隐节点数就是所选择的隐输出阵的列向量数,所以,找到最优的隐输出阵的列向量就能设计出最小的网络结构。RBF网络的数据中心从样本数据的输入中选择,那么RBF网络的最小结构设计问题,等价于寻找满足目标误差的隐输出阵的最优列向量。隐输出阵的列向量的选择,可以看作为路径优化问题,因此,本文采用进化策略的方法对隐输出阵进行全局寻优,以找到最优的隐中心。

进化策略和遗传算法都具有较好的全局搜索能力,比较适用于寻找最佳的神经网络结构或参数。在神经网络结构设计时,主要利用它们同时进化结构和权,但是当网络规模较大或权参数较多时,会极为耗时,对权参数进行编码时,会产生编码精度问题,精度过高时,计算时间迅速增加,精度过低,权参数值的精度低。由于RBF网络的输出层是线性层,其权矢量通过最小二乘法很快能够获得,所以,在进化策略中不进行权值优化,只用于数据中心的数目和位置的优化,本质上仍是如何寻找最佳的路径问题[121]。在搜索RBF中心问题上,进化策略优于遗传算法,因为在对隐输出阵的列矢量组搜索中,较适合采用变异操作,不适合采用交叉操作。如果采用交叉操作,易使个体中出现重复的列矢量,而进化策略中没有交叉操作。利用进化策略在隐输出空间内进行多点随机搜索,所有的输入样本都有可能被搜索到,这样有可能找到全局最优解。

在这里,RBF网络的输出权值采用上面的最小二乘法计算,基函数的扩展常数采用上面的试错法确定的0.84,利用进化策略进化优选隐节点的数目和中心,下面介绍其进化方法及试验结果。

(1)个体编码。在进化策略中,1个个体就是1条不重复的经过所有搜索点的路径,如果RBF网络的隐输出阵列矢量是N维,本文中N为432,则每个个体就是由1~N的N个不重复的自然数排列构成,共有N!个个体构成初始种群,组成整个解空间。

(2)适应度函数的选择。ES选择的搜索点数量d代表了隐层单元的数目,所以,d越大表示该搜索路径所找到的隐节点数目越多,其适应度越低。如果2个个体搜索到的隐节点数量d相等,则比较它们的网络误差ε,如果某一个体所对应的网络误差更小,则这个个体具有较高的适应度,通常d≥1,0≤ε

(3-6)

式中,d为选择的隐中心个数,d∈[1,N],ε为网络误差,k为实数,通常0≤kε

通常ε

(3)d值计算方法。设学习误差限为ε0,假设一个个体按照其待选中心的组合顺序,依次增加输入数据作为隐中心进行网络训练,当网络误差第一次满足ε

(4)子个体产生方法。子个体的产生主要是采用变异的方法,设P=[p1,p2,…,pN]为父个体,pi∈[1,N],随机产生两个位置i,j≤N,交换pi和pj的位置,便可产生一个子个体,该过程称为变异。当样本维数较高时,产生一个子个体可以经过多次变异得到,称变异次数与样本维数之比为变异率,其值可以大于1。

变异位置的选择影响搜索的效率,如果两个变异位置都位于已选中心之内或之外,这样的搜索就变成了随机搜索,增加了计算量,并且破坏了优良个体。理论证明[116]:只有i≤d,且j>d和i=d,且j

按照上面的变异方式,个体变异以固定的变异率进行进化,如果变异率较大,在进化后期会破坏优良个体,如果变异率较小,在进化初期,个体变异效率低,增加搜索时间。因此,在变异开始,个体应该以较大的概率进行变异,加快寻找最优解,而当接近最优解时,降低变异率,避免破坏优良个体,甚至变成随机搜索,所以,变异率应该是根据寻找到解的情况进行自适应调整。本文按照下式进行自适应调整个体的变异率Pc[119]

式中,Pc_max和Pc_min分别为变异最大概率和最小概率,根据寻优问题的复杂度设定,可以在0.3~0.9之间选择,iter和itermax分别为当前迭代代数和最大迭代代数,f和fmean分别为个体当前适应度和种群平均适应度。如果个体适应度比种群平均适应度大,并且在进化后期时,说明个体优良,即隐中心数少并且误差小,应该逐渐减小变异尺度,以提高局部搜索能力;反之,应该增加变异率,采用较大的变异尺度以保持种群的多样性,加快寻找最优个体;随着迭代的进行,变异率逐渐减小。这种变异率自适应调节方式,在进化初期全局搜索能力较强,而局部搜索能力较弱,在进化后期,全局搜索能力渐渐弱化,局部搜索能力渐渐加强,优良个体能够得到有效保护,有利于找到全局最优解,避免出现“早熟”现象。

基于进化策略的RBF网络训练步骤如图3-6所示[122]。

数据集经过归一化处理后,分为两部分:前432组数据作为训练数据集,后288组数据作为测试数据集,表3-5中数据为测试数据集中随机抽取的部分归一化测试数据,全部数据见附表1~5。

采用(μ+λ)型进化策略,父个体数μ为10,每个父个体产生9个子个体,种群数为100,采用上文的自适应变异方法,最大进化代数为25代,终止条件为连续三代种群的平均适应度不超过3×10-15或达到最大进化代数,变异最大和最小概率分别为0.3和0.8,隐中心扩展常数为0.84,输出权值采用最小二乘法计算,训练步骤为:

(1)群体初始化。确定亲体数μ=10,每个父个体产生子个体数λ=9,随机产生μ个父个体,每个父个体代表一组数据中心,成为第1代亲体P(1),并令迭代次数k=0;

(2)计算第1代群体中各亲体的实际训练误差εi和选择的路径长度di(即隐中心个数),根据式(3-6)计算出每个个体的适应度;

(3)根据每个亲体的适应度,按照表达式(3-7)的自适应变异概率,在每个亲体周围以变异方式1和方式2共产生λ-1个子个体;

(4)计算所有子个体的实际训练误差εi及其数据中心数di;

(5)所有亲体及子个体组成种群,按适应度大小选择μ个最佳适应度的个体,做为下一代亲体Pk+1;

(6)k=k+1,如果k等于最大迭代代数,或连续三代种群的平均适应度不超过3×10-15,则转到步骤(7),否则,转到步骤(3);

(7)网络训练结束,输出最优良的个体作为网络隐节点数和中心值。

三、基于PSO算法的温室环境RBF网络模型

OLS算法将RBF网络隐中心的选择归结为线性回归中子模型的选择问题,这种算法能自动地避免网络规模过大和随机选择中心带来的数值病态问题,能够设计出较小的网络结构,但是,如果训练样本中包含有较强的噪声数据时,用它构建的RBF网络会拟合样本中的噪声数据,并可能产生过拟合现象,影响网络的泛化性能。正则化方法是一种改善神经网络泛化能力的有效方法,文[123]提出了正则化正交最小二乘法ROLS(RegularizedOrthogonalLeastSquares)设计RBF网络的方法,通过贝叶斯方法产生正则化系数,避免网络过分地拟合样本中的噪声数据,从而改善了网络的泛化能力。但由于正则化系数与其他一些学习参数之间相互强烈耦合,采用贝叶斯方法获取的正则化系数值并不是最佳的[124]。为了进一步提高网络模型的泛化能力和抗干扰能力,优化网络参数,本文采用正则化正交最小二乘法构建网络模型,利用粒子群算法优化网络参数。

考虑一多输入单输出的RBF网络设计,采用高斯径向基函数,并假设基函数的扩展常数取相同的数值,网络输出可以定义为:

式中,x=[x1,…,xm]T为网络的输入向量,θi为第i个隐节点到输出的连接权值,ci=[c1,i,…,cm,i]T为隐层第i个径向基函数的数据中心,‖?‖为欧氏范数,σ为基函数的扩展常数。

假设共有N个训练样本,x(k)为网络的样本输入,y(k)为样本输入所对应的期望输出,设网络数据中心从样本输入数据中选取,将每个样本输入都选为RBF网络的数据中心,第i个隐输出为

期望输出为

式中,e(k)表示网络实际输出与期望输出y(k)的偏差,写为矩阵形式为

式中,Y为输出向量,Θ为权参数向量,e为偏差向量,Ф为N×N维回归矩阵。

使用Gram-Schmidt正交化方法对回归矩阵Ф进行正交分解

式中,A为N×N维三角矩阵,它的主对角线元素为1,对角线下方为0,W为正交矩阵,它的任意两个列向量Wi和Wj都满足,于是回归模型(3-9)可表示为

式中,正交权参数向量g满足

所谓正则化方法就是在标准误差项基础上增加一个限制逼近函数复杂性的项,即正则化项,该正则化项体现逼近函数的“几何”特性,正则化方法的总的误差项定义为

E(F)=EN(F)+λER(F)

式中,为标准误差项,F为逼近函数,(xi,yi)为训练数据集,λ为正则化系数,λ≥0,ER(F)为正则化项。

对上式进行标准化后,得到

因此,正则化后的误差下降率可定义为

在此基础上,和正交最小二乘算法选择重要的回归因子一样,当满足下面条件时,选择结束,

式中,0

式中,,经过多次迭代后,就可以找到一合适的λ值。

RBF网络需要学习的结构参数主要包括基函数的中心、扩展常数和隐中心数,这三个参数直接影响了网络精度和泛化能力,在前面的方法中是通过试错法确定了扩展常数,然后学习隐中心数和中心值。然而,如果扩展常数选择不当,同样会影响网络的泛化性能。扩展常数类似于人类的视神经系统的作用机理,如果视野太宽,就无从分辨物体的细微之处,如果太窄,整体信息可能丢失,因此,RBF网络的扩展常数也需要优化选择。正则化系数可以由Bayesian方法迭代学习得到,但通过这种多次迭代的梯度方法获取的正则化系数一般是一个局部最优值,只是在特定扩展常数下可能找到的较好的值,并不是全局最优的。实际上,网络的泛化性能与扩展常数和正则化系数之间构成了一种复杂得多峰曲面空间,为避免ROLS算法陷入局部最小,增强网络泛化性能,必须利用一种具有全局搜索能力的优化算法选择最佳的扩展常数和正则化系数。

基于群体智能理论的粒子群优化算法,通过种群粒子之间的合作与竞争产生群体智能指导优化搜索,与其他一些优化算法相比较,具有算法简单、易实现、计算量小和计算效率高的优点,因此,在神经网络的拓扑结构和权值的优化中已得到了成功应用。如果同时优化中心数、中心值和扩展常数势必使计算量过大、算法复杂度剧增。因此,本文采用将粒子群算法和ROLS算法有机结合起来,用ROLS算法寻找合适的网络结构,即确定网络的隐节点数和中心值,用粒子群优化算法在扩展常数和正则化系数的所有可能取值组合的可行解集合中找出最优解,使定义的适应度函数值达到最小,从而优化RBF网络的结构设计,提高RBF网络的泛化能力。

PSO算法采用实数进制编码方式,在解空间内产生P个候选解,每一个粒子都通过所定义的适应度函数计算其适应度值fi,然后更新每一粒子的速度和位置,产生新种群,多次迭代后,最终代的最优粒子就是扩展常数和正则化系数的最优解。

基于PSO和ROLS算法的网络模型训练流程如图3-11所示,将数据集分为训练样本集和测试样本集,在给定粒子的λi和σi值下,利用训练样本集通过ROLS算法设计RBF网络,当正则化后的误差下降率小于预设某一值时,算法回归因子的选择过程结束,计算测试样本集的期望输出与样本集网络输出之间的均方误差,此均方误差就是该粒子的适应度函数项。设FR(x(k))为对测试样本的实际网络输出,FS(x(k))为测试样本的期望输出,nt为测试样本数,则适应度函数为

适应度函数值越小,所设计的RBF网络的泛化性能越好。用粒子群算法优化扩展常数和正则化系数比直接优化网络拓扑结构和权参数的计算量少得多。

基于PSO和ROLS算法的网络模型与文[27]中的BPNN模型性能对比见表3-10所示,基于PSO和ROLS算法的RBF网络模型的隐节点数接近于BPNN模型的10倍,网络结构较BPNN模型复杂了很多,但是,模型误差均小于BPNN模型的,温度误差平均值相对减小了0.0023℃,湿度误差平均值相对减小了0.0014%RH,温度和湿度的均方根误差分别减小了0.1049℃和0.4028%RH,说明正则化方法能有效抑制噪声数据,提高了模型拟合精度,温度模型效率相对提高了0.0283,湿度模型效率相对降低了0.0076,模型效率总体上有所提高,说明正则化方法能很好地抑制噪声数据对网络建模的影响,提高了湿度的拟合精度,PSO算法能找到较优的扩展常数和正则化系数,有效解决了网络过拟合问题,使得网络模型的泛化能力和鲁棒性得到提高。

四、基于PLS算法的温室环境RBF网络模型

在RBF网络的训练过程中,如果采集到的温室数据的输入变量之间含有较高程度的相关性、或者数据点容量不足,都会造成RBF网络的建模精度下降。在温室环境建模中,输入变量有7个,输出变量有2个,系统相对复杂,输入变量之间可能会通过某种复杂的传递关系存在有一定的相关性,这会导致模型的回归系数误差增加,甚至失效,另外,对温室这样复杂的大系统建模,究竟需要多少有效样本点能够充分表示其特性,样本点太多,增加计算成本,并可能带来噪声数据的干扰,因此,为了解决温室环境建模中出现的这些问题,本文采用了偏最小二乘法提取输入数据的主成分的方法,构建RBF网络模型。偏最小二乘回归方法在回归建模过程中,利用了信息的筛选和综合技术,不是直接建立输入变量与输出变量之间的回归模型,而是在输入、输出变量系统中提取出一些新的综合变量(成分),它们对系统有最好的解释能力,然后利用这些成分进行回归建模。

本节首先介绍了偏最小二乘法的原理和计算方法,然后介绍了基于偏最小二乘法的RBF神经网络的构建方法,最后建立了分级偏最小二乘法的RBF网络温室模型,并对由该方法得到的模型的泛化性能进行分析。

1、偏最小二乘算法

偏最小二乘回归(PLS,PartialLeastSquaresRegression)是一种新型的、先进的多元统计数据分析方法,是伍德(S.Wold)和阿巴诺(C.Albano)等人于1983年首次提出的,用以解决化学样本分析中存在的变量多重相关,以及解释变量多于样本点等实际问题。由于PLS回归能够解决许多以往用普通多元回归方法无法解决的问题,因而得到了有关研究人员的重视,PLS线性和非线性回归的理论及方法得到迅速发展,其实际应用也不断扩展,涉及化学、机械、工业、生物、地质、医学、药物学、社会学以及经济学等领域[125]。Wold将非线性变换与偏最小二乘结合,提出了若干种非线性偏最小二乘模型,为采用PLS方法处理非线性问题作了开创性工作。

当利用多个输入变量进行回归建模时,输入变量集合中包含了十分复杂的信息,主要包括有用信息、重叠信息和无意义信息等[126]。有用信息是确实有用的系统信息,是解释输出变量变化的重要因素。重叠信息是指在系统建模中,所选用的多个变量之间常常有较严重的多重相关性,不同的变量可能会重复地解释同一内容,或者通过某种传递关系而发生联系和作用,它们反映的并不是独立的、互补的信息。由于变量之间存在这种多重相关性,常常会导致参数估计失效,扩大模型误差,使模型的可靠性大大降低。无意义信息是指在系统信息中对系统毫无解释意义的信息,但由于在多变量系统中变量间存在极其复杂的关系,很难清晰的识别和准确的筛选这类信息,它们的存在势必给系统的建模带来极为不利的影响。

在数据分析中常用的分析方法有主成分分析法、典型成分分析法、Fisher判别法和PLS算法等,PLS算法有机地结合了主成分分析、变量间的典型相关分析和多元线性回归,对系统信息进行重新组合和抽取,同时从自变量矩阵和因变量矩阵中提取若干成分,它们具有对系统最强的解释性,避免了重叠信息和无意义信息的影响,从而克服了变量之间的多重相关性,得到更为准确、可靠的分析结果,而且该算法具有极快的收敛速度,因此在许多领域得到了日益广泛的应用。

PLS回归建模具有以下特点:

(1)可以建立多个输出变量与多个输入变量的模型,特别是当输入变量间存在较严重的多重相关性时,应用PLS算法进行建模,要比对各个输入变量做多元回归更为有效,整体性更强,结论更可靠;

(2)可以较好地解决许多传统回归分析方法所无法解决的问题,如样本点容量不充足和输入变量之间的多重共线性等问题;

(3)可以综合应用多种数据分析方法,如主成分分析、多元线性回归分析和典型相关分析等分析方法,可以得到更为丰富的数据分析内容,对建立的模型有更细致、深入的解释。

PLS算法是在建模过程中应用了信息的综合与筛选技术,特别是当输入变量之间存在多重共线性时,它是一种非常有效的数据分析和建模方法,它的内容十分丰富,而思想方法却又巧妙简单,便于在实际工作中操作和推广,因此,近些年来它在理论、方法和应用方面都得到了迅速的发展和应用[127]。

2、偏最小二乘算法原理

RBF网络的输出层为线性层,因此,其输出层权值通常采用最小二乘法计算得到,而当在自变量系统中存在严重的多重共线性时,如果应用最小二乘法建立回归模型,则所得模型的可靠性和准确性都得不到保证。因为在一般的多元线性回归模型中,如果有一组自变量X=[x1,x2,…,xp]和因变量Y=[y1,y2,…,yp],根据最小二乘法,有

式中,是的估计量。由式(3-17)可以知道,必须是可逆阵,才能求出回归系数,当X中的变量间存在完全相关性时,(XTX)则是不可逆矩阵,所以,无法得到回归系数;当X中变量间存在较严重的相关性时,│XTX│几乎接近零,这时得到的(XTX)的逆矩阵存在极大的误差,这个最小二乘估计量就会失效,并且随着自变量之间的相关程度的不断增强,回归系数的估计误差将迅速扩大。

多重相关性对最小二乘计算带来的影响包括:当输入变量完全相关时,将完全无法估计最小二乘回归系数;当输入变量间存在严重的多重共线性时,较难进行回归系数的统计检验;当输入变量间高度相关时,样本数据的微小变化都将影响回归系数的估计值,估计值的稳定性将变得很差,很难解释回归系数的物理含义;当输入变量间不完全相关时,随着输入变量间的相关性的不断增加,回归系数的估计方差将迅速扩大。为了解决这些问题,PLS回归分析采用了主成分提取的办法进行回归建模。下面介绍偏最小二乘回归分析的建模思想[123]。

设采集n个样本点,系统有p个输入变量{x1,x2,…,xp}与q个输出变量{y1,y2,…,yq},为了研究输出变量与输入变量的统计关系,构成输入与输出变量的数据表X=[x1,x2,…,xp]∈Rn×p和Y=[y1,y2,…,yq]∈Rn×q。PLS回归分别在X和Y中提取第1个主成分t1和u1,其中t1是x1,x2,…,xp的线性表示,u1是y1,y2,…,yq的线性表示,这两个主成分要满足以下要求:u1和t1的方差达到最大,即u1和t1要尽可能多地携带它们各自数据表中的变异信息;u1和t1的协方差尽可能最大,即u1和t1的相关程度尽可能最大。这两个要求说明,u1和t1要能更好地代表数据Y和X,同时成分t1要能最好地解释成分u1。

提取第1个主成分t1和u1之后,PLS回归分别进行X对t1的回归和Y对u1的回归,如果回归方程已经满足要求,则终止算法;否则,将继续利用Y被u1解释后的残余信息和X被t1解释后的残余信息进行第2次主成分的提取,如此重复提取,直到能得到一个满意的精度为止。如果算法终止时,由X中提取了t1,t2,…,tm共m个成分,PLS将进行yk(k=1,2,…,q)对t1,t2,…,tm的回归,最后表示为Y关于原变量x1,x2,…,xp的回归方程。

由于PLS回归方法从自变量X中抽取的成分t1,t2,…,tm之间是相互直交的,因此,用普通最小二乘法求Y关于t1,t2,…,tm的回归方程时,就不会遇到多重相关性问题。这也说明,在第一步PLS回归计算时,抽取了对系统解释性最强的综合变量,而在第二步则抽取了第一步抽取后对系统解释性最强的综合变量,如此继续抽取,并且这些综合变量中所携带的信息是不重叠的,后续抽取的信息对前面抽取的信息能够起到直交互补的作用。

3、偏最小二乘计算方法

将数据X和Y作标准化处理后的数据矩阵分别记为E0=[E01,E02,…,E0p]∈Rn×p和F0=[F01,F02,…,F0q]∈Rn×q。标准化处理就是指对数据同时进行中心化-压缩处理,即(i=1,2,…,n;j=1,2,…,p),为第j个自变量的平均值,sj为第j个自变量的方差。

第1步记E0的第1个主成分为t1,t1=E0w1,w1为E0的第1个轴,是一个单位向量,即‖w1‖=1;F0的第1个主成分为u1,u1=F0c1,c1为F0的第1个轴,‖c1‖=1。

如果要t1和u1能很好地分别代表X和Y的数据信息,要求t1和u1的方差最大,Var(t1)→max,Var(u1)→max;同时,因为回归建模的需要,又要求u1能被t1最大限度地解释,即t1和u1的相关性应达到最大,r(t1,u1)→max。因此,综合上述要求,应要求t1与u1的协方差达到最大值,即

通常SPRESS,hj总是大于SSS,h,SSS,h则总是小于SSS,h-1,下面比较SPRESS,h和SSS,h-1。SPRESS,h是增加了1个成分th,但却含有样本点的扰动误差;SSS,h-1是用所有样本点拟合的具有(h-1)个成分的回归方程的拟合误差。如果含扰动误差的h个成分回归方程的拟合误差能在一定程度上不大于(h-1)个成分回归方程的拟合误差,就可以认为增加1个成分th,会明显提高预测的精度。因此,希望SPRESS,h/SSS,h-1的比值越小越好,通常认为SPRESS,h/SSS,h-1≤0.952时,增加1个成分th对回归是有益的。

另一种等价定义称为交叉有效性,对每一个因变量yk,定义

对于全部因变量Y,成分th的交叉有效性定义为

(3-41)

利用交叉有效性判断成分th对回归模型精度的贡献,可以依据下面两个条件:

(1)当≥0.0975时,成分th的贡献是显著的,显然该条件完全等价于SPRESS,h/SSS,h-1≤0.952;

(2)对于k=1,2,…,q,至少存在1个k,使得≥0.0975,这时增加1个成分th,至少能明显改善1个输出变量yk的预测模型,因此,认为增加成分th对模型精度明显有益的。

4、基于PLS的径向基神经网络

RBF网络因其简单的拓扑结构和最优逼近特性而得到了广泛应用。在RBF网络中,由于只有一层连接矩阵,使得它可以采用保证全局收敛的线性优化算法,但是,对于输入存在严重多重相关性的情况,直接利用最小二乘法计算将使回归系数估计值的方差变大,精确度和稳定性都会降低,当更换样本中的个别数据时,都会使所得的回归系数的值产生很大的变化,如果从一个样本到另一个样本时,得到的回归系数就会有很大的差异,由此得到的RBF网络的可靠性和泛化能力均不能得到保证。

将RBF网络的结构特点与PLS回归方法的优势结合起来,用PLS方法提取数据集的主成分,来构建RBF神经网络的方法,被应用于水文预报和工业过程分析,这种方法减少了数据多重相关的影响,比其他学习方法需要更少的学习次数,得到的神经网络模型具有良好的泛化性能[129]。

设输入向量x有n个自变量,输出向量y有l个因变量,样本集中有m个样本,这样,输入X为m×n维矩阵,输出Y为m×l维矩阵。

在RBF-PLS方法中,常用高斯函数作为径向基函数来进行非线性变换,得到隐层响应矩阵H,其中第i行第j列的元素为:

i,j=1,2,…,m

矩阵H为对称矩阵,主对角线上的元素为1,隐层输出矩阵为m×m维方阵,与输入的维数无关,而仅由样本的个数决定。

在隐层输出矩阵H与输出矩阵Y之间进行PLS回归运算,提取主成分T后,将H与Y分别映射到主成分矩阵上,得到RBF-PLS网络:

其中T为H的m×nT维主成分矩阵,W为H的m×nT维转换矩阵,R为nT×l维的回归系数矩阵,F为m×l维的残差矩阵。在利用PLS成分进行回归的过程中,选择参加回归的PLS成分个数非常重要,一旦成分个数确定,回归模型即可确定。如果所选的成分太少,不足以反映因变量的变化,如果所选成分过多,因一些成分的方差很小,即包含了多重相关性,将影响网络的稳定。

在上述应用PLS回归构建RBF网络模型中,把H与Y之间得非线性关系转换成了线性代数问题,得到的RBF-PLS网络被用于进行泛化运算:

但上述方法是将所有的样本点作为隐节点,在隐层的响应矩阵和输出矩阵之间应用PLS回归方法。这样的学习方法有计算量大的缺点,而且隐节点过多,容易出现过拟合现象,影响所得网络的泛化性能。

5、分级偏最小二乘的RBF网络学习算法

传统的RBF-PLS算法将所有的样本作为隐节点,而实际只需要其中一部分就可以构建合适的网络,并且简洁的结构有助于提高网络的泛化性能,所以本文采用了分级RBF-PLS算法建立温室环境模型,在每一步运算中进行两级选择,即在进行PLS算法提取主成分的同时选择合适的隐节点数目,得到的神经网络具有较简洁的网络结构,有助于提高神经网络的泛化能力。由于减少隐节点与PLS回归提取主成分的共同作用,得到的RBF网络防止了或减轻了过拟合现象,网络的泛化性能得到了提高。

由于分级RBF-PLS方法是选取全部数据中的一部分来进行建模,所以在确定主成分的提取次数上,可以利用整个训练数据进行验证,而无需进行所得网络与训练数据之间的交叉验证。

分级的偏最小二乘RBF网络学习算法步骤如下:

(1)在第k步,从输入和输出样本集X和Y中随机选取出一组数据xk和yk,分别加入训练样本U和V,向量uj(j=1,2,…,k)成为隐节点中心;

(2)对于样本集U和V进行传统的RBF-PLS网络构建,并得到泛化模型:

Vp1=Hp1W1R1

式中Hp1和W1分别为k×k维和k×nT维矩阵,R1为nT×l维矩阵。将得到的网络对集合U中的样本进行泛化,设立精度阈值e1用于确定主成分提取次数nT,如果泛化的均方根误差RMS小于设定的精度阈值e1时,停止提取主成分,

设立精度阈值e1的目的是为了防止提取过多的主成分而产生过拟合现象,使网络的泛化能力变差,同时可设定在连续两次计算的均方根误差的变化量小于ρ1时停止提取主成分。

(3)将得到的网络对整个数据集X中的训练数据进行泛化,设立精度阈值e2,当泛化的均方根误差RMSnT小于e2时,停止增加RBF网络中的隐节点,

式中,Vp2=Hp2W1R1。

设立精度阈值e2的目的是为了确定合适的网络规模,防止产生过拟合的现象,这里Hp2为m×k维矩阵,其中cj=xj(j=1,2,…,k),同时可设定在均方根误差的变化量小于ρ2时停止增加RBF网络中的隐节点;

(4)如果RMSnT大于精度阈值e2,则重复步骤(1)~(3);

(5)算法在RMSnT小于精度阈值e2时结束。

集合U中的向量即为所得RBF网络的隐节点,得到的主成分个数nT和循环步数k即为最终所得RBF网络的主成分提取次数和隐节点数目。

如果精度阈值e2设置过小,可能出现在经过设定的最大迭代次数后泛化精度都无法低于该阈值的情况。在这种情况下,则由精度的连续变化小于某一设定值作为停止准则,来确定主成分的提取次数,即选取满足e2(nT)-e2(nT-1)

分级RBF-PLS算法的合理性在于,可能只需要全部数据中一部分就可以通过提取主成分来表示出数据中隐含的有用信息,通过逐渐增加网络规模,同时进行泛化能力的校验,可以找到较小规模的网络和确定相应的主成分提取次数,较小规模的神经网络具有更好的泛化能力,而且可以减小所得网络在应用中的运算量。

6、基于分级RBF-PLS算法的温室环境模型

1.采用上述的分级RBF-PLS算法构建了温室环境温、湿度模型[133],前432个数据构成训练集,采用全部数据构建网络,有432个待选的隐节点中心,后288个数据构成测试集,用于验证网络的性能,表3-11为从测试数据集中随机抽取的部分归一化后的测试数据,全部数据见附表1~5,精度阈值设为e1=e2=0.4(温度),==2.4(湿度),ρ1=ρ2=0.05,径向基函数的扩展常数取为0.84。

2.基于OLS算法的温室环境模型具有最快的运算速度,也能找到较小的网络结构,它在温度和湿度平均误差、温度均方根误差、温度模型效率上均优于BPNN模型,但是,在湿度均方根误差和湿度模型效率上均差于BPNN模型,其各项误差及模型效率均比本文其他三种方法差,网络结构最为复杂,说明该方法无法抑制噪声数据的影响,对易受扰动的湿度量的拟合波动较大,网络模型的泛化性能较差;

3.基于ES算法的温室环境模型具有最简的网络结构,得到最小的湿度平均误差(-0.0003%RH)和最大的温度模型效率(0.9916),在各项误差性能指标和温度模型效率上均远远优于BPNN模型,但湿度均方根差和模型效率不是最好的,其湿度模型效率(0.9595)低于BPNN模型的模型效率(0.9800),说明采用全局优化算法寻优隐中心是有效的,能够找到最小的网络规模,其网络规模(隐节点数为51)远远优于OLS算法的,网络模型的泛化性能和鲁棒性较好,但是,对湿度的拟合效果不好,存在较大的误差波动,对噪声的抑制能力有限;

4.基于PSO和ROLS算法的网络模型的模型效率总体上均优于其他模型,温度和湿度模型效率分别为0.9883和0.9724,误差大的离散点少,相对拟合精度较高,湿度平均误差和均方根误差均较小,湿度模型效率比BPNN的湿度模型效率低0.0076,对湿度的拟合较优,隐节点数为57,网络结构优于基于OLS算法和PLS算法的模型。说明PSO算法为RBF网络寻找到较优的扩展常数和正则化系数,使ROLS算法能够更好地抑制噪声数据的影响,提高了易受扰动的湿度的拟合精度,避免了过拟合现象的出现,并得到较简单的网络结构,提高了网络的泛化性能和精度;

5.基于PLS算法的温室环境模型的温度平均误差和湿度均方根误差均最小,温度模型效率仅小于基于ES算法的温度模型效率,大部分温度数据点拟合较好,有部分数据点有较大偏差,湿度平均误差和均方根误差均较小,但是,模型效率却较低(0.9656),说明在多数湿度拟合点上拟合情况较好,但是,受到湿度噪声数据的影响,存在较大的偏差点。因此,说明PLS算法能够提取数据的主成分,进行网络训练,避免了输入变量之间的相关性的影响,提高了模型部分参数的性能,但是,其精度易受到噪声数据的影响。虽然其网络结构不是最优的,但是,PLS算法计算量较小,可以在线应用,在测试中仍然可以完成主成分的提取,提高了网络的泛化性能和精度。

第五节本章小结

本章分别采用了四种不同的方法建立温室环境网络模型。首先采用OLS算法训练RBF网络模型,实验表明,该算法简单,运算速度快,算法稳定性好,能够得到较小的网络结构,但是不能得到最小的网络规模,网络的泛化性能较差,尤其是湿度的均方根误差最大、模型效率最低,该算法对数据噪声的抑制能力较差。

针对OLS算法不能找到最优的模型结构的问题,本文首次将基于进化策略的RBF网络应用于温室环境建模,采用进化策略在隐中心空间进行全局搜索,寻找最优的隐节点数和隐中心,得到了最简单的模型结构,仿真实验结果表明,该算法建立了最简单的网络结构,隐节点数51,模型的泛化能力得到较大提高,温度模型效率最高(0.9916),温度的均方根误差最小(0.2157℃),说明温度拟合点上无较大的误差点,湿度的平均误差最小(-0.0003%RH),湿度均方根误差较大,在湿度拟合点上存在较大的偏差,对数据中的噪声抑制能力不足。

在上述两种方法中,隐节点的扩展常数是采用试错法得到的,无法保证是最优值,同时,如果样本中含有较强的噪声数据,网络可能会过多地拟合噪声数据,出现过拟合现象。针对上述问题,本文首次将基于PSO算法和ROLS算法的RBF网络应用于温室建模,采用正则化OLS算法建立温室模型结构,为了得到最优的扩展常数和正则化系数,采用PSO算法进行全局寻优,仿真实验结果表明,该方法所得温室模型可以有效地避免噪声数据对网络训练造成的影响,湿度均方根误差最小(1.5072%RH),湿度的模型效率最高(0.9724),提高了模型精度,温度和湿度模型的综合效率最好(分别为0.9883和0.9724),优化后的扩展常数使网络有更好的视野,提高了模型泛化能力。

由于输入变量之间的多重相关性引起模型回归系数的误差增加,或由于样本点不充分,易造成网络模型精度的下降。针对温室环境模型输入变量较多,而且可能存在某种复杂的相关性,本文首次将基于PLS算法的RBF网络应用于温室环境建模,将偏最小二乘法与RBF网络的训练相结合,利用PLS提取输入变量的主成分,进行网络模型的训练。实验结果表明,PLS回归方法可以有效地克服数据间的多重相关性对模型参数的影响,提高了网络的拟合精度,所得模型的温度和湿度的平均误差最小(分别为-0.0066℃和0.0005%RH),并且该方法适合于在线学习和在线建模,一旦模型精度不能满足要求,就会对输入变量重新进行主成分的提取,重新建立满足性能指标要求的网络模型。

通过对本文所建立的四种模型的性能分析,基于OLS算法的网络模型具有最好的效率,但是,网络结构复杂,模型泛化性能较差;基于ES的网络模型具有最简单的网络结构,最好的温度模型效率,但是对噪声数据的抑制能力有限;基于PSO和ROLS算法的网络模型具有最好的噪声抑制能力,网络模型误差最小,能自动建立较简单的模型结构,温度和湿度的模型综合效率最好;基于PLS算法的网络模型能够有效避免输入变量的多重相关性的影响,湿度模型效率有所提高,温度和湿度的平均误差整体性能最好。
* 温馨提示:关注微信公众号: xiaoyida_com ,回复 xse93390 在手机上阅读完整章节!

------第四章温室环境控制器的------

设计与仿真

第一节引言

目前,在温室温度控制中通常采用分段式调节方法,往往注重控制精度,将温室温度保持在作物生长的最适温度,而造成温室生产能耗较高,而实际上,作物的生长发育与一段时间内的积温有关,不是取决于某一温度点。根据作物的积温特性和作物对温度的缓冲能力,可以制定更加灵活的温度调控策略,以达到节能生产的目的,但是,积温控制受到差温、湿度等因素的影响和制约,因此,应根据当地气候特点和作物积温特性,制定合理的积温控制策略。

在温室环境各因子中,温度和湿度对作物的影响最大。温度和湿度主要受加热设备的控制和外界光照、外界温度、风速等因素的影响,温室温度和湿度采用的调节机构主要是开关控制设备,去驱动电机系统或电磁阀工作,来改变温室内的温度和湿度。在实际工作中,温室温度控制通常采用设定值控制,即早晚各设定一个参考值,如果温室温度超过参考值,即启动加热设备或通风设备,这种方式没有考虑作物的积温特性,能量消耗大,经济成本高;湿度调节主要采用喷雾加湿和通风降湿或加热降湿的方法,温度和湿度调节独立动作,没有考虑相互间的耦合,温室环境调节不合理,无法达到经济、适宜的生产环境。因此,设计一个具有合理调节动作和良好控制特性的温室环境控制器,是温室农业优质、高效生产的重要保证。

第二节北方温室积温控制策略的研究

基于积温的控制程序同传统的控制程序有很大不同,如图4-1,在温度上、下限之间的温度范围被称为自由空间或带宽。积温控制可以根据作物所能承受的绝对日温、夜温以及作物对不同温度波动的缓冲能力(即带宽),设定温度上限、下限和积温控制的时间范围,并保证作物在各生育时期的平均温度仍为最适温度。

根据积温控制的基本原理,可以通过灵活设置各个气候因子的界限,协调各个因素之间的制约关系,以降低温室生产能耗,具体考虑如下:(1)根据温室作物的承受能力和生活习性,设置各个气候因子的界限值,如温度下限、上限和最大相对湿度等;(2)根据作物不同时期对室温波动的缓冲能力,确定灵活的积温控制时间范围和界限;(3)尽可能充分利用白天的热能来补充作物积温,在夜间尽可能保持室温在作物生长的下限温度以上,以降低能耗;或者在加热不经济的情况下(如风速高、保温幕开启、室外温度低等)降低温度的设定点;而在加热经济的情况下(如风速低、保温幕关闭、室外温度高、阳光充足、或有廉价热源等)补充作物积温,保证作物在各个生育时期的平均温度仍为最适温度,即积温总量不变。

在积温控制应用中,因为温度与其他气候因素的相互作用和温度对一些作物生长因素的间接作用,积温控制策略受到差温和湿度等因素的制约和影响。负差温与积温控制原则正好向背,需要消耗更多的能源;温室湿度设定点太低,会因为不该加热时提前加热或不该通风时提前通风,造成温室能耗增加。

由于温室中的温度和湿度的耦合较强,两者相互制约,所以,湿度对积温控制应用的限制最强,尤其在北方春秋季节,早晚温差大,易出现低温高湿的情况,午后在不通风的情况下会出现高温高湿的情况,因此,应该根据北方温室外界气候特点和作物的积温特性,合理制定温室环境积温控制策略。

本文研究对象为蝴蝶兰,其生长适温为16~28℃,温度低于10℃,花卉停止生长,温度高于32℃,植株生长缓慢,适宜湿度为60%~90%,湿度太低,不利生长,花朵变小,色泽不够艳丽,湿度太高易产生病害。

根据蝴蝶兰的生活习性、积温控制的基本原则、北方气候特点和专家经验,本文探讨了北方温室环境的积温控制策略,并应用于温室环境控制器中。北方温室春季环境的积温控制策略如下:

(1)温度控制带宽的设定。根据K?rner的研究结果,适当加大温度控制带宽,可以大量节约能源,另据Rijsdijk的研究报道,适当的带宽不会影响作物的品质和产量,而蝴蝶兰的生长适温为16~28℃。因此,本文确定温度控制带宽为±6℃。

(2)与湿度的协调控制。因为湿度是影响积温控制的主要因素,在不影响作物生长的情况下,湿度设定点不易太低,否则会因为降湿而消耗过多的能源。本文设定湿度控制范围为60%RH~90%RH,湿度设定点在80%RH。对于早晚的低温高湿情况,可以根据外界温度和温室内部温度,采用开窗通风或加热除湿的方法,在能够满足作物积温的情况下,尽可能采用开窗通风除湿,并且注意保持温室温度不低于作物的下限温度;对于午后高温高湿的情况,既要考虑到尽可能利用白天充足的外界热能和光照,多积累热量,增加积温,促进作物的光合作用,又要考虑到高湿易使作物生病,因此,除湿尽量采用开窗通风和除湿电机的配合动作,加快空气湿度降低,这样可以解决湿度对积温控制的限制。

(3)通风的调节。由于北方春季外界温度较低,应尽量减少通风操作,以减少温室内外对流交换而损失过多的热能,在下午外界温度较高,并且内部湿度超限时,可以适度开窗通风,当外界温度较低,内部温度较高,并且湿度较高时,天窗可以开较小开度,同时配通风扇的动作,加快温室内部湿度的降低,当外界风速较高、或雨雪天气时,天窗关闭。

(4)加热调节。在光照充足时,适当地提升室温,有利于光合作用的进行,因此,在室内照度达到15000Lx时,加热阀开度加大,但是,注意室内温度不能超过设定的上限温度;当阴天或夜晚时,照度降低,光合作用减弱,这时加热阀开度调小,保持室内温度为作物生长下限温度(15℃)以上即可;当室内湿度较高,而且不易进行通风时(雨雪、大风等),适当加大加热阀开度,以降低室内湿度;在通风时,为减少加热的无功损耗,加热阀关闭。

(5)保温幕的调节。保温幕也是降低温室能耗的有效方法之一,保温幕材料适宜和操作合理的情况下,可以大量减少加热耗能。在春秋季节,为防止温室热能的泄露,保温幕应晚揭早盖,使温室尽可能多接收外界热能,减少能源使用和室内热能损失。在清晨,当照度上升到8000Lx以上时,打开保温幕,以多接受光照,提升室内温度;在傍晚,当照度下降到8000Lx以下,或外界温度降到-5℃时,关闭保温幕,以减少热交换损失。

(6)遮阳网调节。光照过强,容易使作物受伤,当光照大于40000Lx时,遮阳网展开,当小于40000Lx时,遮阳网收拢,保证温室能尽可能多地接收光能,提升室内温度,减少能源消耗,使作物多接收光照,促进光合作用。

根据蝴蝶兰的积温特性,为实现温室节能生产,减少湿度控制对积温控制的影响,需要根据当地的气候条件和温室结构,确定合理的温度和湿度界限值,以上所提到的操作阈值需要根据当地的气候条件和作物的生活习性具体设置。在确定控制策略时,可以不需要气象预报信息,而利用过去的温度和湿度信息来改变温度设定值的上下界和降湿设定点。在计算机运算时,需要提供作物生长的安全界限值,即最低温度、最高温度和最高湿度值,将积温策略与常规控制方法有机结合起来,这样种植者能根据需要在某些特定情况下实施确定的目标温度和湿度控制策略,而在其他情况下,允许计算机根据积温要求自由地设置目标温度和湿度控制点,使温室温度和湿度满足作物积温要求和生长要求。

第三节神经网络控制器

温室气候控制通常被设计成设定点跟踪,例如,常常至少设定一个温度设定值,然后,控制器抑制干扰,发出调节动作,控制并保持在温度设定点。但是,这种控制方案在设计中没有考虑温室能耗问题。在实际应用中,以最小的能耗保持适宜的气候条件是非常重要的,气候参数不必保持在某一个设定点,而是保持控制变量在一定范围内就已经足够了。

由于PID控制技术在工业生产中广泛采用,应用技术成熟,因此在温室环境控制中也得到广泛应用,这种基于模型的传统控制方式,是根据被控对象的数学模型以及对控制系统要求的性能指标来设计控制器,并对控制规律进行数学解析描述。但是,由于温室系统是一个强耦合、大滞后、非线性的复杂大系统,易受外界气候的影响,难以获得其准确的控制模型,并且PID参数大多是依靠经验和观察设定的,采用简单的PID控制方法,无法创造温室作物生长的最佳环境条件。

温室环境PID控制系统在实际应用中存在的缺陷是:由于变量之间存在较强的耦合,而PID控制只是采用单输入-单输出的闭环控制,导致系统控制性能差;没有考虑约束条件;过于注重设定值跟踪,而没有考虑能量消耗。

由于神经网络的自适应能力、并行处理能力和鲁棒性,使它具有很强的非线性映射能力,使得神经网络控制系统具有更快的计算速度(实时性)、更强的适应能力和鲁棒性,神经网络控制主要是针对系统的非线性、不确定性和复杂性来进行的,通常神经网络在控制系统中的应用情况有以下几种[115]:

(1)在基于精确数学模型的各种控制结构中作为对象模型,构成各种控制结构,如内模控制、预测控制;

(2)在反馈控制系统中直接作控制器;

(3)在传统控制系统中作为优化计算的手段;

(4)在与其他智能控制方法和优化算法(如专家控制、模糊控制及遗传算法、粒子群算法等)相融合中,为它们提供非参数化对象模型、优化参数、推理模型等。

神经网络控制主要是为了解决复杂的非线性、不确定、不确知系统在不确定、不确知的环境中的控制问题,使控制系统的稳定性好、鲁棒性强,具有满意的动态和静态特性。在神经网络控制系统中,信息处理过程通常分为自适应学习期和控制期两个阶段,在学习期,网络按一定的学习规则调整其内部连接权重,使给定的性能指标达到最优;在控制期,网络连接模式和权重已知且不变,各神经元根据输入信息和状态信息产生输出。两个阶段可以独立完成,也可以交替进行。

目前神经网络控制系统的分类尚无统一的标准,根据不同的观点,神经网络控制的结构和种类可以有不同的形式划分。根据控制系统的结构,可以把神经网络控制的应用研究分为监督式控制、逆控制、神经网络自适应控制和预测控制等方向[130]。

神经网络监督控制就是通过对人工控制器或传统控制器的学习,然后利用神经网络控制器取代或逐渐取代原控制器的方法,如图4-2所示,它包括一个监督程序(导师)和一个可学习的神经网络控制器NNC,NNC的输入对应于传感器采集的输入信息,NNC的输出对应于人对系统的控制输入,其本质就是利用神经网络的非线性映射能力,学习人与受控对象打交道时获取的知识和经验,从而最终取代人的控制行为,它需要一个监督程序,为神经网络训练提供从人的感觉到人的决策行为的映射,导师可以是人也可以是常规控制器。神经网络监督控制实际上就是建立人工控制器的正向模型[115],经过训练,神经网络记忆该控制器的动态特性,并且接收信息输入,最后输出与人工控制器相似的控制作用。在监督控制结构中,神经网络的行为分为学习期和控制期,在学习期,网络通过训练来逼近系统的逆动力学特性,在控制期,神经网络根据期望输出和参考输入得到正确的输入。这种结构的缺点是人工控制器靠视觉反馈进行控制,而利用神经网络控制器进行控制后,由于缺乏视觉反馈,所构成的控制系统实际上是一个开环系统,其稳定性和鲁棒性均得不到保证。实现神经网络监督式控制的步骤如下:①通过传感器采集信息并进行信息处理,从中提取必要的和有用的控制信息;②选择神经网络类型、结构参数和学习算法等,构造神经网络控制器;③训练神经网络控制器,实现输入和输出之间的映射,以进行正确的控制,在训练过程中,可以采用线性律、反馈线性化或解耦变换的非线性反馈作为监督程序来进行训练。

神经网络内模控制是利用被控对象的模型和模型的逆构成控制系统,它为非线性反馈控制器的设计提供了一种直接方法,具有较强的鲁棒性。其结构如图4-6所示,系统模型NN2与受控对象并行设置,反馈信号由系统输出与模型输出之差得到,然后由与系统的逆有关的控制器NN1进行处理,引入滤波器是为了获得更好的鲁棒性和跟踪响应效果,对于线性系统,这种结构要求对象是开环稳定的。内模控制的主要特点有:

(1)设描述对象模型算子的逆是存在的,用这个逆做控制器,构成的闭环系统是输入输出稳定的;

(2)设被控对象和控制器是输入输出稳定的,模型是对象的完备表示,则闭环系统是输入输出稳定的;

神经网络预测控制又称为基于模型的控制,其结构如图4-7所示,算法的本质特征是预测模型、滚动优化和反馈校正,该算法对非线性系统有期望的稳定性。在神经网络预测控制中,首先由神经网络预测器建立受控对象的预测模型,并可以在线修正,然后由预测模型根据系统当前的输入、输出信息预测未来的输出信息,最后由神经网络预测器给出未来一段时间内的输出值和期望输出值,对定义的二次型性能指标进行滚动优化,产生系统未来的控制序列,并以第一个控制量对系统进行下一步的控制。

第四节温室环境神经网络控制器的

设计与仿真

一、温室环境控制系统结构

由于温室系统是一个复杂的大系统,容易受到内部及外界的干扰,其精确数学模型难以得到,致使以数学模型为基础的传统控制方法难以创造作物生长的最佳环境条件。而神经网络控制主要是针对系统的非线性、不确定性和复杂性来进行控制的,因此,根据本文的研究对象特点和模型的特点,确定了采用神经网络控制的方案,以上文所建立的温室环境控制模型为仿真对象,设计了神经网络控制器,并进行了仿真实验。

在温室环境中,影响因子有很多,如温室内的温度、湿度、光照等,但是,对作物影响最显著的是温度和湿度[131~132],因此,本文以温室内部的温度和湿度控制为目标,其他因子作为扰动因子来考虑,控制器的输入为温室内部的温度和湿度与其设定值的偏差,输出为电机和电磁阀等执行机构的控制量,调节对象包括:天窗、遮阳网、保温幕和加热阀。

根据上述情况,设计了温室环境神经网络控制系统,结构如图4-8所示,tS、hS分别为温度、湿度设定值,其在一定的时间内为某一常数,在一天内为变量,et、eh分别为模型输出温度、湿度值与其设定值的偏差,控制器根据该偏差调节天窗、遮阳网、保温幕和加热阀等的动作,风速、太阳照度、外界温度等可测而不可控的变量作为扰动量d,遮阳网和保温幕的调节根据外界温度和照度进行开关调节,天窗和加热阀的调节量以当前开度与最大开度的百分比来表示,如式(4-1)和(4-2)所示。

在实践应用中,首先由神经网络控制模型根据上一章的学习方法学习温室系统的特性,当网络结构及参数确定后,由温室神经网络控制模型代替温室系统,进行神经网络控制器的结构及参数学习,当学习完成后,由神经网络控制器取代常规控制器,控制温室系统环境参数。

二、控制规则的制定

本文的研究对象为种植有蝴蝶兰的温室系统,根据所确定积温带宽±6℃。温度和湿度设定值根据蝴蝶兰生理特性,在不同的时间段设定不同的温度和湿度值,保证作物一天的积温总和不变,在夜间,将温度设定值尽可能降低,保证温度在作物生长温度的下限以上,但是当温室内湿度过大,而又不能开天窗通风时(春季外界温度太低),采用加热除湿的方法,温室内作物生长温度的下限为15℃,湿度上限为90%RH,因此将夜间温度设定值设置为15℃,当温度低于该值时加热升温,当温度达到17℃时,停止加热,如果湿度达到90%RH以上时,加热除湿,当湿度降低到70%RH时,停止加热,这里将温度上升幅度设为2℃和湿度下降幅度设为20%RH,是在调节温度和湿度的同时,考虑到调节系统的动作频率,如果差值太小,会使得调节系统频繁动作,容易引起系统振荡,调节品质降低。

在春秋季节,北方温室内的温度主要由加热和通风设备来控制,温室中的加热系统采用热水管道加热系统,利用调节阀调节热水流量,从而控制室内温度;加热阀的动作根据温室内的温度和湿度进行调节,当温室内部温度低于15℃或湿度大于90%RH时,加热阀开到最大,尽快提升温度或降低湿度,当室内温度升到17℃或湿度降到70%RH时,加热阀开度减小,当温度升到23℃或湿度降到60%RH时,加热阀开度进一步减小;当光照充足时,适当升高温室温度,有利于作物光合作用的进行,并且有利于作物能量积累,这时将加热阀开度加大,但应注意不能使室内温度超过作物生长上限温度。当外界光照较弱时,作物的光合作用将减弱,这时不适合加热升温,只要尽量保持室内温度不低于作物生长的下限温度即可,所以,调节阀开度通常设置在较小位置。

保温幕的合理调节是减少温室热能散失的有效方法,是温室节能生产的保障措施之一。在夜间为保持室内温度,减少加热耗能,采用保温幕进行保温,保温幕的动作由电机驱动。当光照强度和外界温度达到一定数值时,保温幕开启,具体动作的阈值由当地的气候条件和室内温度来确定。在本文中,根据温室专家建议,当外界照度达到8000Lx以上时,开启保温幕,使温室尽量接受光照以减少室内供热能耗,同时有利于作物的光合作用进行,促进作物生长;当外界照度下降到8000Lx以下或外界温度下降到-5℃以下时,关闭保温幕,保持温室内的热量,减少温室内外热交换引起的能量损失,以上阈值需要根据当地的具体外界环境条件确定。

天窗开度的调节:温室通风主要完成降温和除湿调节,由天窗电机和除湿风机的调节完成,其动作需要根据温室的温度和湿度来进行,尤其在春秋季节,天窗的启动必须注意外界温度的影响,早晚外界温度太低,如果开启天窗会造成室内温度剧降,超过作物的下限温度。根据专家建议,温室天窗的开启应该在外界温度大于2℃时,并且最好在日出时开启。当室内湿度达到90%RH以上,并且室外温度达到2℃以上时,天窗开启以尽快降低室内湿度,在天窗开启时,为了减少热源的无功损耗,这时停止加热,由于外界温度过低,为防止温室内作物冻伤,当室内温度降到作物生长下限温度时,关闭天窗,加热阀调节到最大开度。

遮阳网的调节:为防止温室内光照过强,采用遮阳网调节室内光照,遮阳网的动作由电机驱动。当光照大于40000Lx时,遮阳网展开,使作物不会受到灼伤;当光照小于40000Lx时,遮阳网收拢,保证温室能尽可能多地接收光能,提升室内温度,减少能源消耗,促进作物光合作用。

三、温室环境网络控制器的设计

由于RBF网络具有结构简单、训练简洁、收敛速度快、能逼近任意非线性函数等特点,因此,温室环境控制器结构采用了3层的RBF网络,结构如图4-9所示,输入为温度和湿度设定值与模型输出值的偏差,输出为加热阀、保温幕、遮阳网和天窗的调节量,网络输入层为2个节点,输出层为4个节点,隐层的基函数采用高斯函数,输入的偏差信号经隐层神经元非线性转换得到隐输出阵,线性输出层根据隐输出计算得到各调节信号输出,调节信号直接输入给3.3.1节建立的基于OLS算法的温室环境模型,温室环境模型根据调节量得到温度和湿度的输出,输出量反馈到比较节点,与设定值进行比较。外界风速、温度和照度作为温室环境模型的扰动量d。

第五节本章小结

利用作物的积温特性,可以制定灵活的温室温度控制策略,大量减少温室的能源消耗,尤其是可以大大减少北方温室春秋季的加热能耗。但是积温控制受到湿度的影响和制约,需要合理解决两者之间的控制矛盾。本文根据蝴蝶兰的生长适温和北方春季气候特点,制定了相应的温室温度和湿度的控制策略,在阳光充足的白天,利用太阳能提高温室温度,减少加热操作,在外界温度较高的午后,采用通风操作,降低室内湿度,室内湿度设定点尽量保持在80%RH左右,减少因降湿而频繁加热的能耗,并将该控制策略应用于温室环境控制器控制操作中。

由于温室环境的复杂性,采用传统控制方法难以创造作物的最佳生长环境,因此,本文以上文所建立的蝴蝶兰温室网络模型为控制对象,以温度和湿度的偏差为输入,以加热阀、天窗调节等为输出,结合制定的积温控制策略,进行了温室环境控制器的设计,并进行了仿真实验。实验结果表明,温室内的湿度和温度能够控制在蝴蝶兰生长的适宜环境条件内,温度波动少,白天加热,夜间保温,湿度多数情况下保持在80%RH以上,湿度对温度的调节影响较小,只有26日午后受外界温度和照度变化的影响,室内温度和湿度出现较大波动。加热阀和天窗调节动作频率低,26日由于温室内部湿度较大,天窗开启1次,减少了温室通风引起的热损失;加热阀在白天8个小时以上开度都较大,夜间开度较小,符合积温控制的动作要求;遮阳网在照度大于40000Lx时展开,其他情况收拢,保证温室内部的光照时间,在6时到16时,光照充足和外界温度较高时,保温幕收拢,在16时以后,光照较弱并且外界温度较低时,保温幕展开。从神经网络控制器的输出调节曲线和温室模型输出的温度、湿度曲线来看,温室环境控制效果较好,能够实现温室的低能耗运行。

结论

对于温室环境这样的复杂大系统,采用传统的数学解析法难以建立其准确的模型,采用以精确数学模型为基础的传统控制方法控制温室环境,在兼顾生产能耗和控制精度时,难以创造作物最优生长环境。针对我国北方温室环境模型的缺乏,以及温室环境的最优控制问题,本文首先建立了北方温室春季环境温湿度的模型,并根据积温控制原则和作物的生理特性,研究了北方温室春季环境的积温控制策略,在此策略的指导下,研究了温室环境智能控制器,使温室环境达到作物生长的理想环境。

本文的研究成果和创新点概括如下:

1.建立了基于进化策略的温室环境RBF网络模型。OLS算法在从输入数据中寻找隐中心时,无法找到最少的隐节点,而RBF网络的性能只与所选的隐中心有关,与隐中心选择的顺序无关,因此,可以将隐中心的选择看作为组合优化问题。本文首次应用进化策略优化温室环境模型结构,利用ES在所有样本点中寻找最优的隐节点数和隐中心,建立更为简单的模型结构。仿真结果表明,基于ES的RBF网络模型具有最小的网络结构,得到最高的温度模型效率(0.9916)、最小的温度均方根误差(0.2157℃)和湿度平均误差(-0.0003%RH),具有更好的泛化能力;

2.提出了将PSO算法和ROLS算法结合,建立温室环境模型。如果样本中包含有较强的噪声数据时,RBF网络会过多地拟合样本中的噪声数据,影响网络模型的泛化性能和鲁棒性,另外,RBF的扩展常数通常采用试错法得到,而扩展常数的优劣也将影响网络的精度。正则化方法能够有效改善神经网络的泛化能力,本文首次将PSO算法和正则化OLS算法应用于温室环境温湿度建模,采用粒子群算法优化扩展常数和正则化系数,利用ROLS算法提高模型的噪声抑制能力,仿真实验结果表明,该模型得到较好的综合模型效率,温度和湿度模型效率分别为0.9883和0.9724,对于易受扰动的湿度,该模型得到的湿度拟合的均方根误差最小(1.5072%RH),具有很好的噪声抑制能力和较高的拟合精度;

3.将PLS算法与网络建模相结合。由于温室环境模型是多输入-多输出的大系统,如果输入变量间有较强的相关性,或由于计算成本的限制而引起的样本点不足,将直接降低温室模型的精度和可靠性。本文首次将PLS算法应用于北方温室环境建模,研究了基于主成分提取和网络结构设计分级进行的温室环境网络模型,将PLS方法提取的数据中的主要成分,用于网络模型的结构设计和回归运算,避免了数据间的相关性影响,所得模型的温度和湿度平均误差最小(-0.0066℃和0.0005%RH),有较好的可靠性和泛化性能;

4.制定了北方温室积温控制策略。应用积温控制能够有效地实现节能降耗生产,这对北方温室环境控制是非常重要的。本文以蝴蝶兰为研究对象,根据其生长习性、积温控制原则和北方春季气候特点,研究并制定了北方温室春季环境的积温控制策略,确定积温控制阈值以及湿度设定点,妥善解决了影响积温控制的各因素之间的关系,并将该策略用于神经网络控制器中;

5.研究并实验了温室环境控制器。采用常规控制方法很难以较低的能耗创造最优的温室生产环境,因此,本文研究了温室环境神经网络控制器的结构和算法,结合所制定的积温控制方法,进行了仿真实验。实验结果表明,温室内的温度控制在16~23℃,湿度控制在63.7%RH~90.7%RH,各执行设备根据积温控制方法的要求协调动作,减少了温室加热、降湿和通风的调节,神经网络控制器具有较好的控制特性,能够创造作物生长的适宜环境和实现温室的节能运行。

本文的研究展望:

1.利用积温控制策略是实现温室节能降耗生产的重要方法,作物的积温特性是积温控制的重要基础,而我国在作物积温特性上的研究起步较晚,因此,研究蝴蝶兰的积温特性,将是本文下一步研究的主要问题,这将是对温室环境有效控制的更深入的研究;

2.本文研究并仿真了温室环境神经网络控制器,控制器的仿真性能良好,本文下一步将针对具体的生产现场进行试验,并将作物的积温特性和相应的积温控制策略,应用于温室环境智能控制器。未完待续......欲知下回,请关注微信公众号: xiaoyida_com ,回复 xse93390 获取完整内容!
----------
本小说内容节选自:人文社科小说 《基于RBF网络的北方温室环境控制机理的研究》

作者:赵斌
最后更新于:2016年09月08日
----------
温馨提示:如何阅读完整内容?
方法一:点击下方 “阅读原文” 链接去读小说“基于RBF网络的北方温室环境控制机理的研究”后续完整章节!
方法二:关注微信公众号: xiaoyida_com (优美小说节选),回复 xse93390 阅读后续完整章节!


    关注 小意达


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册