《基于RBF网络的北方温室环境控制机理的研究》:第一章绪言

 

------第一章绪言------



第一节本文研究的目的及意义

我国的人均耕地只有世界水平的1/3,耕地是极其珍贵的资源,而利用高新技术实现耕地使用的最大效益化,无疑是我国改造传统农业生产的一条必由之路。温室是一个限制内外空气流动的密闭空间,形成内外环境的差别,创造作物适宜的生长环境。温室生产就是综合运用各种先进设施和技术,人为创造各种作物生长发育的最佳环境条件,并通过科学的经营管理,最大限度地提高土地产出率、资源利用率、劳动生产率和产品商品率,获得最佳经济效益和社会效益的一种完全有别于传统农业的生产模式,它具有高投入、高运行成本、高产、优质和高效等特点,能够有效地节约土地。温室农业在我国有着越来越重要的经济和社会效益。

近年来,我国温室产业发展迅速,截止到1999年底的数据表明,我国大陆地区现有现代化大型温室面积约580hm2,其中引进温室面积已达180多公顷,90年代中期以来,根据中国国情和气候特点,自行设计、建造了一批经济适用的大型温室,面积达400多公顷,覆盖了我国所有的省、市、自治区,我国温室面积居世界各国首位。但是,由于缺乏配套的技术和设备,环境控制能力低,技术含量低,生产潜力有限;依靠引进温室设备,一次性投资大、生产成本高,对操作人员素质要求也高,而且由于我国地域辽阔,气候差异大,引进设备很难适合我国的国情。

上述情况得到国家高度重视,先后在“九五”攻关项目中启动了“工厂化温室设施及配套装备研制”课题,在“十五”攻关项目中启动了“温室环境智能控制关键技术研究与开发”课题,在“863”计划“可控环境农业生产技术”的研究内容中包含了研制可控环境自动控制系统、信息自动采集系统等,2003年国家计委启动了“设施农业技术集成产业化示范”课题,国家自然科学基金生命科学部对设施园艺也设立了重点项目,2009年,“十一五”国家科技支撑计划再次启动“现代化农业与机械化耕作技术研究与示范”项目,其中包括了“现代高效设施农业工程技术研究与示范”课题。由此可见,我国设施农业在国家的高度重视和关注下,研究范围和深度不断地扩大,取得了许多可喜的成绩。

现代化温室是采用先进科学技术设计、制造而成的工厂化生产设施,并为不同的作物生长、繁育提供良好的生态环境,它可以不受地点和气候的限制,最大限度地提高土地利用率,实现作物的优质、高产。温室设施主要包括温室结构和环境调控设施两个方面,而温室环境调控是现代化温室的必备功能。

温室环境模型作为温室内外环境、作物和控制设备之间相互作用与内在关系的定量描述,无论在温室结构设计和环境控制中都具有重要作用。国内外学者采用机理法和测试法对温室环境模型进行了不懈的研究,但是,由于温室环境具有大惯性、纯滞后、非线性、时变性、强耦合以及其他的不确定性因素,使得其精确模型很难得到。国内对日光温室环境的研究较多,如胥芳等[1]分析了温室小气候中辐射、通风、对流和作物蒸腾作用引起的质、热交换物理机理,应用传热传质机理,建立了温室小气候温、湿度模型;王定成等[2]利用支持向量机回归建立温室环境模型,宫赤坤等[3]等利用神经网络建立南方温室的温度模型。国外对连栋温室模型的研究取得一定的成果,如TakakuraT.[4]建立了第一个较为完备的动态模型,但因为它主要是针对传统单层玻璃温室建立的,适用面不广;KindelanM.[5]探讨了温室环境的动态模型,建立了基于能量和质量平衡的方程;FerreiraP.M.等[6]建立了温室温度预测神经网络模型。虽然国外在温室环境模型的研究中已经取得很大的成绩,但是已有模型的准确性和适用性还有待提高。以上研究很大程度上还限于单个环境因子的研究,国内的研究多为南方温室环境模型的研究,而对北方温室环境模型的研究较少。由于模型的缺乏或不准确,使得以数学模型为基础的传统控制方法和现代控制理论难以取得较好的控制效果,造成温室生产能耗大、生产成本高、环境条件不能满足作物生长的最佳条件。研究具有北方气候特点的温室环境控制模型,以指导温室设计人员、控制人员等更有效地进行温室相关工作,提高北方温室现代化程度和整体运行效益,具有重要的意义,这也是北方温室设计和环境控制技术迫切需要解决的问题。

温室环境控制技术是温室生产技术的核心,是当代农业生物学、环境科学、计算机控制与管理科学的综合应用,是对温室环境因子进行综合调节和控制的技术,它为不同作物的生长、繁育提供适宜的环境,同时实现系统节能降耗运行。利用这项技术可以安排作物全年均衡生产,提高作物的产量和质量,使环境资源和生态资源得到有效的利用。温室控制技术的研究经历了几十年的发展,从早期的开关控制及PID控制发展到最优控制。例如JonesP.等[7]采用PID控制器实现了温室环境的计算机控制,我国学者董乔雪等[8]采用PID控制实现了温室温度、湿度等计算机分布式控制系统,这些传统控制方法在处理温室这种具有强耦合的多输入—多输出、时空变异大、非线性强的生物过程控制问题中,很难获得比较理想的效果。由于智能控制技术具有不依赖控制对象的数学模型、鲁棒性好的特点,被温室控制技术研究者广泛采用,例如ChaoK.等[9]采用模糊控制器实现了温室的分阶段加热和通风控制,朱伟兴等[10]采用遗传算法优化温室温湿度模糊控制器,实现了较好的动态、静态特性,并降低了系统成本。但是,这些研究多是针对本地气候的单因子研究,国内主要集中在南方温室环境控制系统的研究上,主要是升降温控制,同时对环境因子的控制多数采用的是设定值控制,即将环境因子设定在某一数值,并没有考虑环境因子的累积效应,造成温室生产能耗大。目前,针对我国北方温室环境节能控制技术的研究较少,北方气候的季节差异性大,各季节的环境控制因子的侧重点也不同,例如冬季主要是升温,夏季主要是降温,春秋季早晚温差大,既要考虑夜间升温,也要考虑日间降温,还要考虑湿度对作物的影响,同时兼顾生产成本问题,控制难度大,由于缺乏有效的主动环境调控手段,极大地制约了北方温室的发展。

由于地理位置及环境的不同,外界气候对温室小气候的影响也不同,如果完全照搬南方温室环境模型和控制方法所得的结论应用于北方温室,必然不会得到良好的控制效果。现在北方温室多数还是采用人工控制方法,这种生产方式完全依赖于操作人员的经验,温室环境质量不高,不能实现优质高产。由于北方春、秋、冬季时间较长,温室加热能耗较大,这也是制约北方温室发展的瓶颈,很多温室由于能耗大、运行成本高而停止生产,造成资源的浪费。因此,对于北方温室环境的建模和实现最优控制是促进北方温室发展的迫切任务。

第二节北方温室气候特点与季节划分

中国农业气候区划是反映全国农业生产与农业气候关系的区域划分,是全国农业自然条件的一个部门区划,其任务是揭示农业气候的地域差异,分区阐述光热水等农业气候资源和农业气象灾害,本着发挥农业气候资源优势,避免和克服不利气候条件,以及因地制宜,适当集中的原则,着重对合理调整大农业结构,建立各类农业生产基地,确立适宜种植制度,调整作物布局,以及农业发展方向和农业技术措施等问题,从农业气候角度提出建议和论证。

我国北方地区位于大兴安岭、青藏高原以东、内蒙古高原以南、秦岭-淮河以北,包括东北三省、黄河中下游各省的全部或大部、甘肃-宁夏的东南部、江苏和安徽两省北部等地区。根据我国农业气候区划的划分,大兴安岭北部地区、嫩江-小兴安岭地区、松花江-牡丹江地区、松辽平原等均属于东部季风农业气候大区,东北三省主要位于该大区的中温带,农业气候指标:≥0℃积温2100~3900℃,最热月平均气温16~24℃,最冷月平均气温-30~10℃,年平均气温2~4℃,年日照射数2500~2900小时,日照射率56~65%。本文以黑龙江省哈尔滨市农科院园艺分院花卉温室,温室位于北纬45°45,东经126°41,属于东部季风农业气候大区中温带,主要气候指标为:≥0℃积温2600~3900℃,年湿润度0.5~1.0,年降水量400~500mm,冬寒夏凉,无霜期短,低温冷害,多大风。南方地区主要属于东部季风农业气候大区北亚热带、中亚热带气候带,年极端最低气温多年平均-10~0℃,≥0℃积温5500~7000℃,最热月平均气温>26℃,最冷月平均气温0~11℃,年降水量>800mm,年湿润度>1.0,夏热冬暖,夏秋多雨。由此可见,南北气候差异较大,

季节的分类方法通常有:天文划分法、气象划分法、古代划分法、农历划分法和候温划分法等,候温划分法是以五天为一候,当候平均气温稳定到22℃以上时为夏季,候平均气温稳定在10℃以下时为冬季,候平均气温从10℃上升到22℃期间是春季,候平均气温从22℃下降到10℃期间是秋季,这种划分方法在黑龙江省需要在5月中旬以后进入春季,不符合我省的农时要求,因此,本文采用前四种划分法,春季基本在3月~5月之间,夏季在6月~8月,秋季在9月~11月,冬季在12月~2月。

第三节国内外相关研究现状及发展趋势

一、国内外在环境建模方面的研究现状及发展趋势

温室环境受到许多因素的影响,而且这些因素彼此相互作用,为了能更好地制定相应的调控策略,就必须了解温室内部各环境因子之间的关系,建立其准确的模型。在温室环境中同时存在着物理现象和作物生理现象,因此要建立一个全面的、完善的模型是相当困难的。国内对温室环境模型的研究较为薄弱,国外虽有一定的研究成果,但已有模型的适用性、准确性还有待提高,尤其近几年温室环境调控技术与设施的发展,以及对环境变化过程的研究取得新的进展的情况下,温室环境模型还需要进一步研究发展。

温室环境建模通常有两种方法:机理法和测试法。机理法就是根据温室生产过程中实际发生的变化机理,写出各种能量平衡方程,从中获得所需数学模型。随着对温室中各种物理过程研究的逐渐深入,各国学者建立了一系列的温室环境模型。

胥芳等[1]分析了温室小气候中辐射、通风、对流和作物蒸腾作用引起的质、热交换物理过程,基于质能平衡方程,建立了温室小气候温、湿度机理模型,计算得到温度均方根误差为0.8929℃,湿度均方根误差为3.966%。

李树海等[11]以多层覆盖连栋温室为研究对象,在温室各部分温湿度分布均匀、忽略覆盖材料蓄热作用、土壤水分不导热等假设下,根据质能平衡原理,对覆盖材料、作物、室内空气和土壤等建立质能平衡方程,建立温室的温度和湿度机理模型,能够定量描述温室内的太阳辐射、植物蒸腾、自然通风、对流换热等物理过程。

吴春艳等[12]根据传质传热学的基本原理,考虑了作物通过蒸腾耗热、对辐射的反射和吸收的方式对温室的影响,建立温室内的5个热量平衡方程组,对方程组采用高斯消元法求解,得到日光温室内的温度预测数学模型,实验结果表明,温室温度的预测平均绝对误差为0.9℃,平均相对误差为5.1%。

TakakuraT.建立了第一个较为完备的动态模型[4],但因为它主要是针对传统单层玻璃温室建立的,适用面不广。BotG.P.A.[17]在对Venlo型温室的自然通风、太阳辐射、对流换热等物理过程的实验和理论研究的基础上,建立了温室动态模型,该模型为20世纪80年代初最为复杂的温室环境模型。K?rnerO.等[18]介绍了关于菊花温室能量减少模型,该模型包括了三个子模型:热量模型、蒸发模型和二氧化碳模型,结合温室的温度和湿度控制来减少能量消耗。JoaoIsrgel等[19]利用能量平衡方程,建立了温室气候模型、作物模型和气候预测模型。

温室环境建模的根本目的是预测对外界天气状态和控制系统的确定输入响应的室内瞬态气候值,很多动态模型集中在温室气候的物理和能量平衡上进行温室环境模型仿真研究,这些模型[1,11~26]从物理机理上进行了深入分析,有助于掌握温室中能量传递过程,模型参数有具体的物理意义,容易理解,对温室结构设计及改善、控制系统的设计有着重要的作用。但是,由于温室内部小气候环境受到多种随机因素的影响,例如外界气候变化、作物呼吸及生长状态的变化等,采用这种方法建立的模型,其参数难以确定,因而很难用于实际温室控制中。为此很多学者提出了一些简化数学模型,例如一阶时延系统或二阶系统模型,这些模型中的绝大多数是针对温室气候的部分因子列写能量平衡方程,还有一些则针对某一类控制问题仅考虑其中的一些物理过程,建立了适用于控制的简化模型,在这些简化数学模型基础上求得的控制规律无法实现较好的控制效果。

测试法建模是根据生产过程的实测输入和输出数据,进行某种数学处理后得到的模型,它是基于系统辨识理论的实验建模,主要特点是把被研究过程视为一个黑匣子,完全从外特性上测试和描述它的动态特性。对于温室这种存在众多不确定性因素的非线性大系统建模,测试法建模比机理法建模更有优势。温室环境的测试法建模就是通过温室的物理特性来分析温室模型的结构,然后基于输入输出数据进行参数估计。随着人工智能技术的迅猛发展,人们借助于人工智能技术来解决温室建模问题,其中神经网络技术在温室环境建模中的应用尤为突出。神经网络是一种快速、精确逼近的连续映射工具,它可以加快计算,并提高物理过程参数的精度,能通过有限的参数表达复杂的系统。一个设计合适的神经网络,通过提高计算精度和效率,完全能完成温室环境动态建模。神经网络建模相对于传统建模方法主要优点是不需要用数学表达式详细描述这个过程,更适合于长期预测,它能更灵活地获得温室参数和非线性,使得它对温室环境建模更有吸引力。鉴于神经网络在建模中的优势,其在温室环境建模中的应用越来越广泛。国内外研究者对测试法建立温室环境动态模型进行了大量的研究[2,3,5,27~49],国外研究主要集中在北欧国家,建立了温室内温度、湿度等环境模型。

FerreiraP.M.等[6]采用离线训练、在线学习的方法,以温室外界的气温和太阳辐照度以及内部的湿度为输入,利用RBF神经网络建立温室温度预测模型,以8个隐神经元的网络的为例,其离线训练的温度均方根误差为0.0108℃,在线学习的温度均方根误差为0.0072℃,得到较好的拟合特性和一步预测误差。BorhanM.S.等[27]采用BPNN建立了温室小气候预测神经网络模型,输出为温度、湿度和光照,温度和湿度的预测与它们的上限有关,受遮阳网影响,光照预测的难度较大。ShichaoOu等[28]采用3层BP网络建立温室温度模型,5个输入节点,3个隐节点,1个输出节点,实验得到,温度误差为0.4℃。

国内学者王定成[2]利用支持向量机回归建模的方法建立了南方温室环境温度模型,在忽略外界因素对温室内部气候的影响下,得到一天的温度预测平均误差为0.1288℃。王万良等[35]利用模糊逻辑网络建立了温室分布参数的预测模型,提出了基于神经网络优化计算的优化控制算法,并应用于温室环境的加热升温分布参数过程优化控制中。杜尚丰等[49]采用BP神经网络建立温室温度模型,采用5-10-1网络结构,实验得到温度误差在±1.5℃范围内。国内研究主要集中在南方,建立了温、湿度模型以及作物模型,而对我国北方温室环境动态模型的研究较少。由于神经网络建立的温室模型是针对特定地区和特定气候环境的温室,所以其不能在任意地方通用,同时神经网络建模需要大量的数据,否则在进行外推和演绎时可靠性明显降低,这势必造成数据处理量大。由于北方一年四季气候差异较大,各季节气候特点不同,如冬季温度低,室内不考虑降温,夏季阳光充足,不考虑升温,而春秋季昼夜温差大,既要考虑升温又要考虑降温,环境条件较为复杂。

因此,本文将北方温室环境模型分为三个模型,即春秋季、夏季、冬季模型。采用RBF神经网络建立春季模型,为优化网络结构,采用进化策略(ES,EvolutionStrategies)和粒子群优化(PSO,ParticleSwarmOptimization)算法优选隐中心、隐节点数量、扩展常数等参数,采用偏最小二乘(PLS,PartialLeast-SquaresRegression)算法提取主成分,进行网络模型的训练,通过这些模型的研究能够填补我国北方温室环境模型的空白,指导温室环境的最优控制,并为夏、冬季模型的研究奠定理论基础。

二、国内外在温室环境控制方面的研究现状及发展趋势

温室环境是一个复杂的大系统,其控制因子包括温度、湿度、光照、CO2浓度、营养液浓度等,这些因子彼此相互作用、相互影响,但是不同因子间的耦合强度不同,CO2浓度、营养液浓度相对较为独立,与其他因子之间的耦合较弱,而温度、湿度、光照之间呈现强耦合,控制难度较大。温室环境控制方式通常有两种:单因子控制和多因子控制。单因子控制是对温室环境因子进行单独控制,不考虑其他因子对被控因子的影响,主要应用是控制温度或湿度。但是,外界气候的变化对温室内的环境影响很大,温室内部的各气候因子之间的耦合性很强,影响作物生长的众多环境因子之间相互制约和配合,当其中某一因子发生变化时,其他因子也要相应改变,因此,这种控制方法在保证作物获得最佳环境条件方面有很大的局限性。多因子综合控制是将各种作物在不同生长阶段需要的环境条件要求输入控制系统,当其中某一因子发生改变时,控制系统根据当前输入要求,综合调整各个因子的变化,保证各种作物在不同生长阶段所需适宜环境条件的综合控制方式,但是由于温室系统的目标复杂性、对象复杂性、环境复杂性的特点,真正做到多因子综合、协调控制并不容易。

国内外学者对温室环境控制因子进行了选择和研究,如温度控制、温湿度控制、光照控制、营养液和CO2浓度以及风速控制等研究[32,50-78],这些研究多数是进行单因子控制的研究,我国现有温室的计算机控制系统大多采用单因子控制方式,这种方式在保证作物获得最佳环境条件方面有很大的局限性。在各控制因子中,温度、湿度和光照对温室环境及作物影响最大。鉴于本文研究对象为温室中盆栽蝴蝶兰,根据其种植环境和特点,选择了温度、湿度为控制变量。

随着控制理论从传统控制到智能控制的发展、成熟,温室控制研究者将这些在工业控制中成功应用的理论应用于温室环境控制,期望解决温室环境最优控制问题。但是,温室环境是一个复杂的大时滞系统,具有强的耦合性和非线性,内部既有物理现象又有生理现象,其控制环境远比工业现场复杂。国内外专家已经对温室环境控制进行了大量的研究,其控制方法包括开关控制和PID控制[50~56]、模糊控制[6,9,10,47,56~66]和神经网络控制[20,30,34,48,67~77]等。开关控制存在精度低、静差大等缺点,造成温室生产能耗大,PID控制器设计简单、操作方便,在工业生产控制中应用成熟,所以,PID控制广泛应用于温室环境调控中。如PasgianosG.D.等[50]采用非线性反馈技术控制温室的温度和湿度,能够有效实现高度非线性耦合系统的解耦控制,适合于温室气候的控制;余泳昌等[51]采用改进型的PID控制算法用于温室环境控制,温度控制误差为±0.5℃,湿度控制误差±5%,比传统PID算法有所改进。但是,PID控制需要被控对象的精确数学模型,而温室系统的精确数学模型难以得到,参数的选择依赖于专家经验。传统控制在温室环境控制中面临的主要挑战是控制变量的解耦问题,所以,采用传统控制方法较难实现温室环境的最优控制。

模糊控制(FC,FuzzyControl)是一类应用模糊集合理论的控制方法,具有较强的知识表达能力和推理能力,经过模糊逻辑推理可以实现类似人的决策过程,为非线性控制器的设计提供了一种比较容易的设计方法。模糊控制系统能够更有效地控制含有不确定性的、并且用常规非线性控制理论难以处理的受控对象,它不需要受控对象的精确数学模型,可以根据专家经验实施精确控制,对外界干扰不敏感,系统的鲁棒性强、稳定性好,基本能够解决常规控制方法所无法完成的温室环境调控问题。

ChaoK.等[9]对温室进行了分段加热和通风的模糊逻辑控制研究,利用温室简化动态模型,针对温室温度设定点控制,对模糊控制器和传统分级控制器(CSC,ConventionalStageControllers)进行了稳定性、超调量和均方根误差的对比,并在温室能耗和控制精度间找出折中控制方案,试验结果表明,FC的控制精度和性能高于CSC;王振宇等[59]用常规模糊控制器实现温室温度的控制,实验结果表明,模糊控制系统在控制性能上明显优于传统的开关量控制系统。钟应善等[60]设计了4个输入、10个输出的多变量模糊控制系统,进行了温室温度和湿度控制的仿真实验,结果表明,模糊控制系统超调量小、响应快,温度和湿度控制精度分别为±0.2℃和±1%。

但是,控制规则的制定来源于专家经验或现有的知识,隶属函数的选择依赖设计者的经验,没有统一的制定依据,而隶属函数的优选和控制规则的获取正是设计模糊控制器中最重要和最困难的问题,这将直接影响模糊控制器的性能和温室环境的调节能力。同时,温室环境受到外界及内部作物的影响而随时在变化,因此,需要模糊控制器能够具有自学习、自修正能力。

朱伟兴等[10]用遗传算法优化模糊控制器的隶属函数,实现了温、湿度模糊控制器的优化设计,试验结果表明,优化设计的模糊控制器的温度控制性能优于未优化的模糊控制器,超调量减小了0.4℃,稳态误差减小了0.2℃,优化模糊控制器具有良好的动态、静态特性和较好的节能效果。Caponetto等[56]采用遗传算法优化温室环境模糊控制器参数,并对比了模糊控制器与PID控制器的性能,结果表明,模糊控制器性能优于PID控制器。杨卫中等[61]采用了温室温度模糊控制参数在线自整定的算法,可以根据温度响应曲线的特征参数来在线自动调整控制系统的量化因子和比例因子,优化系统的响应品质,并可以自动检测系统的响应性能指标。虽然优化模糊控制器比常规模糊控制器在性能上得到极大改善,但是,其核心仍是以常规模糊控制器为基础,控制规则、隶属函数等的整体优化、学习能力还是有限的。

人工神经网络(ANN,ArtificialNeuralNetwork)是由简单的处理单元所组成的复杂网络,是对人脑的抽象、简化和模拟,具有很强的并行处理能力、自学习能力、非线性映射能力、容错能力、鲁棒性和自适应性,神经网络可以直接从系统的输入、输出数据中学习得到其网络结构模型,但是,学习完成后的神经网络的权值没有具体的物理意义,其所描述的系统模型很难被人们直观理解,而且不能加入对象的先验知识和做出必要的修改。模糊系统擅长处理定性的知识,能够将专家的经验和知识以规则的形式存储于模糊系统中,用来解决具有非线性、不确定性和强耦合性的复杂控制系统,但是,它缺乏自学习能力,控制规则和隶属函数没有统一的制定依据。模糊神经网络系统兼有模糊系统和神经网络系统的优点,既有模糊系统的透明语言结构、分布式记忆与并行处理的特点,又有神经网络的能逼近任意非线性函数与自学习能力。

Blasco等[30]采用遗传算法优化基于模型的温室气候预测控制系统参数,以实现达到节能和节水的目的,利用遗传算法优化了预测模型参数、能源和水的消耗指标,温度设定范围为18~25℃,湿度设定点为60%RH,控制系统输出结果为,温度保持18~25℃,湿度在50%RH~70%RH。Coelho等[31]采用模型预测控制方法控制温室温度,采样周期1min,预测时域1h,取得较好的控制效果。Coelho等[72]采用粒子群优化算法优化温室温度预测控制器,并与遗传算法优化的控制器对比,粒子群算法优化的控制器的设定点跟踪误差为0.2℃,优于遗传算法优化的控制器,具有计算量小的特点。

王万良等[35]针对温室生物环境控制的复杂性,建立了温室分布参数的模糊神经网络预测模型,提出了基于神经网络优化计算的控制算法。李秀梅等[45]利用改进遗传算法优化模糊神经网络控制器,进行温室的温、湿度控制,控制输出采用开关量输出。宫赤坤等[73]采用神经网络动态辨识系统建立了温室温度和湿度模型,利用模糊神经网络控制器根据温度和湿度偏差调节执行机构,实现对温室温度和湿度的最优控制。对于温室这样的复杂大系统,智能控制比传统控制更具有优势。上述系统多是针对温度或湿度的控制,采用一种智能控制方法与优化方法的结合,同时,温湿度控制通常采用固定值调节方式,温室系统的生产能耗大,或系统调节动作频繁,系统易出现振荡。

由于北方温室春季环境模型的复杂性,其输入、输出变量较多,输出变量温度和湿度之间存在强耦合,而且控制对象的精确数学模型难以得到,采用传统的PID控制方法难以实现最优的生长环境、节能降耗、提高品质和产量的目的。因此,本文采用神经网络智能控制技术,处理这种多输入、多数出、强耦合的控制对象,实现温室环境的最优控制。

三、国内外在积温控制策略方面的研究现状及发展趋势

温室是一个密闭空间,由于限制空气流动和吸收太阳能短波辐射,创造温室内外环境的差别。温室在保持适宜的气候情况下,必须考虑能源效率,由于长波辐射在温室内不同介质(如土壤、加热系统、作物等)间相互作用,造成温室辐射散热,因此,温室应该减少长波辐射,增加短波辐射,改善绝热性能,吸收更多的太阳能,为了优化温室系统应用、最大化节能和优化作物生长,应该精心设计气候控制域。为了达到这个目的,积温理论被采用。

积温(TI,TemperatureIntegration)的概念最早是由法国人F.A.deRéaumur于1735年左右提出的,他发现作物完成某一特定时期的发育,要求一定量的温度累积值。以后积温学说有了很大发展,并不断完善,积温概念也发展为是指作物所测定温度与基准温度之差在某一时段的合计值。积温可分为两种:一种是活动积温,另一种是有效积温。这两种积温的计算都是以生物学下限温度为起点温度,生物学下限温度,又称生物学零度,主要是指作物有效生长的下限温度。一般来说,作物的生物学下限温度就是作物三基点温度的最低温度。活动积温就是作物的某一生育期或全生育期内活动温度的总和,而有效积温则是作物的某一生育期或全生育期内有效温度的总和。

在农业生产实践中,积温的用处主要有三个方面:首先是可以用来衡量一个地区的热量资源,因为一个地区的积温数值是根据多年的气温资料计算求得的,因此,积温的多少可以表示各地热量资源状况,而作物的积温数值是反映作物生长发育对热量条件的要求;其次是可作为作物生育期预测的一个依据;再者是作为作物引种和改制的一个依据。用有效积温表示作物生长发育对温度(热量)的要求,其数值比较稳定。在实际工作中,如做农业气候分析、农业气候区划时,多采用活动积温。研究作物对热量的要求、预报作物生育期以及病虫害预测预报时,多采用有效积温。

在一定时期内有效温度的总和,即为有效积温,有效积温的计算如下:

式中,Tsum为有效积温,Ti为有效温度,n为积温的计算时间段。这里我们主要讨论的是作物所处环境大于或等于其下限温度的有效温度。对于某一年而言,稳定通过作物下限温度的起始日至终止日期间,凡是大于下限温度的日平均气温值分别减去下限温度的差值的总和即为该期间大于该下限温度的有效积温。

由上述可知,作物生长发育的温度是处于一定的温度范围,即下限温度和上限温度范围内,长期处于下限温度会使作物停止生长,长期处于上限温度,会使作物易引发疾病,形成适当的昼夜温差,有利于作物更好地生长,积累干物质,促进作物开花。例如:谢祝捷等[107]研究了温室黄瓜生长与积温的关系,得到结论是:温室黄瓜植株总干物质积累过程随有效积温积累呈“S”形曲线,黄瓜不同器官干物质积累的变化趋势受有效积温积累的影响较大,有效积温是温室黄瓜生长发育的主要调控因子,随着有效积温的逐步积累,植株的生长加速,光合产物向果实分配的比例迅速增大并达到最高。高志民等[108]研究了牡丹催花过程中不同生长发育阶段对有效积温的需求,得出牡丹的催花只有在满足其各生长发育期所需要的积温后,才能顺利进行,而且生长发育所需要的有效积温与品种自身特性有关。由此可见,不同作物对积温需求不同,同一作物的不同生长期对积温的需求也不同,并不是温度尽可能地高就好,适当的温差有利于作物干物质积累和株高的生长。

在现代化温室生产中,由于要保持作物最适的温度条件,以达到理想的品质和产量,能源的消耗势必较大。据测算,温室每生产10kg黄瓜需要5L石油的消耗量,比粮食生产能耗高50~60倍。另据联合国统计,温室加热的耗能量占全世界一年农业生产耗能量的35%,温室能耗的费用占生产总费用的15%~40%[109]。因此,能源消耗成为温室生产成本的主要部分。温室能耗量取决于其内部温度控制策略,内部温度设定点的±1K偏差就会增加1%的能耗,在单层玻璃温室中,夜间保持室温15℃,其能耗是全天能耗的70%,若采用负差温(更高的夜温和更低的日温)控制策略,能耗还会增加。另外保温幕能够减少夜间能耗,它的节能效果常常取决于保温幕的材料和密闭程度,典型的单层保温幕能节能35~40%,双层保温幕节能70%[110]。

节能策略基本方法之一就是:当能源(如太阳能)廉价时,温室就尽可能地升温,当能源较贵时,就尽可能减少加热并保持温度。利用作物的积温特性,在阳光充足的白天获得更高的日温,但是,对于多数作物来说,限制温度波动幅度是必要的,而且要得到负差温的效果,即夜温高于日温,这些就是积温控制应用的限制因素。另一种节能方法是取决于风速的温度控制方法,当风速较低时温室升温,当风速较高时温室则降温,这种方法意味着温室的能耗是随着风速的增加而增加的,能耗主要来源之一是温室的泄露,如果保温幕关闭,能耗减小,如果保温幕密闭性好,风速则几乎不影响室温。因此,节能技术主要从两个方面考虑:首先利用工程技术手段改善温室的硬件性能,如提高供暖设备效率、使用绝热性能良好的覆盖材料等[111];另一种是从作物的生活习性考虑,利用作物的积温特性,也能达到节能的目的。

通过优化温度控制策略或模式是更为有效的节能降耗方法,这种理念往往容易被忽略。这种优化控制模式是基于以下基本理论:即对于大多数作物来说,它们的生长和发育主要与一天24h,甚至更长时段内的平均温度—积温有关,而与精准的温度控制模式关系甚少,如黄瓜[88,129],番茄[89,90],甜椒[91]等作物均是如此。而传统的温室环境控制模式不考虑作物的积温特性,通常是早晚各保持某一固定的温度设定值,是不计生产成本的生产方式,势必造成温室能耗剧增,如果在温室环境计算机控制系统中采用积温控制策略,就能充分实现节约能源的目标。

积温控制策略的主旨是,尽可能利用白天的热能,获得尽可能高的日温,减少加热能耗,夜间则控制尽可能低的温度,以日温补充夜温;或者在加热不经济的情况下,降低温度设定点,如阴天、大风等,而在加热经济的情况下再适当补充积温,保持某一时段内的平均温度仍为作物生长最适温度,这就是积温总量不变的控制原则。研究表明,根据作物对积温的反应,利用计算机对温室环境进行有效的控制,每年可以减少约10%~20%的能源投入[79,80,89,95,101]。

积温控制可以根据作物所能承受的绝对日温、夜温以及作物对不同温度波动的缓冲能力(即带宽),设定温度上限、下限和积温控制的时间范围,并保证作物在各生育期的平均温度仍为最适温度。目前,国外已经进行了大量的积温控制理论研究,并将积温控制应用于部分生产实践[78~96],而国内对积温控制的研究刚刚起步[97~107],主要受到作物生理特性研究的影响,积温控制理论在温室生产中应用较少。

K?rnerO.等[79]认为在作物生长发育的过程中,温度是可以在短时间内偏离其设定点的。利用积温控制策略控制温室温度,不是设定一个温度点,而是设定温度的最大值和最小值,根据作物的生长习性,采用灵活的温度控制方法,是降低温室能耗的一个有效方法,长期温度作用的效果,可以抑制短期内由于温度波动造成作物在光合作用等方面的不良反应。

作物的生长主要取决于长期的平均温度效果,而不是某一段时间内的温度[81]。加热点可以调整到作物不同生长期所需的一个期望的平均温度,在条件合适时升高温度设定点,反之,则降低温度设定点,这样可以达到节能的目的。

BaileyB.J.[93]利用积温理论,根据外界风速调整温度控制指标,研究风速对温室节能的影响,当风速较高时适当降低温度设定点,而当风速较低时升高温度设定点,每年可节能约5%~10%,同时,他以普通温室、带有保温幕温室和具有加热系统的温室为研究对象,调查了不同温室应用积温的节能效果。研究结果表明,在最低温度设定点为15℃和最高温度设定点为25℃的情况下,普通温室和带有保温幕温室每年可以减少3%~15%的能源消耗,具有加热系统的温室每年减少20%的能源消耗。

Lacroix等[94]以积温特性为基础,研究开发了温室模拟控制器,用来模拟不同的温度设定模式下的节能效果。模拟控制器每天运行一次,模拟温室针对不同的预设气象条件作出的反应,从而选择最佳的节能控制模式。研究结果表明,这种控制方式可以降低7%的温室能耗。

Rijsdijk[95]将甜椒、玫瑰作为实验对象,调查了在生产实践中应用积温的可能性。实验中积温时间设为24h,积温带宽设为8℃,并与传统的控制方法进行了比较,研究不同带宽对植株生长和发育、温室节能的影响。研究结果表明:当带宽分别为4℃和8℃时,每年可节约能源分别为8%和18%,带宽越大,温室生产能耗越低,温度控制策略越灵活。同时,带宽在小于等于4℃时,积温控制不会影响作物的品质和产量。

LiebigH.P.等[112]发现光照决定了光合作用(干物质积累),而温度决定了作物的生长(鲜物质积累),而且两者之间的相互作用很弱,这样可以充分利用光照补充温室热能,提升温度,促进作物生长。不同作物有不同的缓冲期,小黄瓜的生长缓冲期为一天,大头菜的缓冲期约为十天,这说明可以通过合理地设置积温控制的时间范围,最大限度地获取作物的综合潜能,是一种降低生产成本的非常有效的方法。

谢祝捷等[107]对自控温室黄瓜生长发育动态及基于有效积温的发育模型进行了研究,观测并分析了自动控制型玻璃联栋温室内有效积温,以及营养液栽培黄瓜全生育期内的主要生长发育性状,研究结果表明,全生育期内黄瓜主要生育特性如株高、节数、干物质积累与有效积温间的相关性均达到极显著。根据完成某一生育阶段的累积有效积温值建立了基于有效积温的黄瓜发育速率模型,并对该模型进行了初步验证,证实通过该模型,用温室环境温度可预测黄瓜发育进程。

高志民等[108]针对牡丹催花过程中不同的生长发育阶段对有效积温的需求进行了研究,研究表明:牡丹的不同品种之间,同一品种的不同发育阶段对有效积温的需求不同,晚花品种达到开花时间所需的有效积温比中花品种多,同一类型品种中花瓣多的品种比花瓣少的品种所需的有效积温多,同一品种经过自然低温处理时间越长,达到开花时间所需有效积温越多。

侯加林等[102]进行了温室番茄生长发育模拟模型的研究,研究结果表明:温度是影响番茄生长发育的最重要的因子之一,通过试验证明:番茄的生长发育速率与温度间呈非线性关系,即存在“温度三基点”,发育速率与温度的非线性关系,很好地解释了日最低温度的相对重要性,当生育期平均温度相同时,日最低温度高时的发育速率更快。

在积温控制应用中,因为温度与其他气候因素的相互作用和温度对一些作物生长因素的间接作用,使积温控制策略受到诸多因素的制约和影响。

首先是差温(DIF,Differencebetweendaytemperatureandnighttemperature),差温是指日间平均温度和夜间平均温度的差值。温室作物的生长受某一段时间内的平均气温的影响,而与具体的温度变化过程关系很小。虽然作物的一些形态学特征不受平均温度的影响,但受差温的影响很大。正差温(日温>夜温)将影响作物节间生长,对株高有促进作用,从而会使许多观赏植物的品质降低;负差温(夜温>日温)将抑制节间生长,可以大量减少使用矮化剂。但是,负差温会影响积温的应用,例如在春秋季节,昼夜温差较大,为了产生负差温效果,需要夜间升温和日间降温,与积温控制策略相反,这时就无法充分利用光照提高温度,造成温室能耗的增加。因此,在实际应用中,应当妥善协调好积温与差温的关系,找出切实可行的温室环境优化控制方案。

其次是湿度,特别是高度绝热温室中,湿度将是对节能的一个主要限制因素。湿度主要是通过叶子大小和受光来影响温室作物生长,而不是在低水蒸气压差(VPD,VapourPressureDeficit)下通过增加气孔导度直接影响作物的光合作用[86,87]。

湿度波动会在几个方面影响作物的生长,太低的VPD会造成作物较低的蒸腾作用和生理混乱,而影响作物生长,当VPD达到露点以上时,水蒸气在低温作物上的结露会引发作物疾病;相反,高的VPD会引起作物高的气孔阻力和作物水分胁迫(PWS,PlantWaterStress),高的相对湿度将引发作物的霉菌病、叶坏死、叶片细薄,钙缺乏,引起作物生长减慢或结构发生改变[84,85],甚至减产,Holder和Cockshull等都曾报道过在高湿度下番茄果实产量下降、叶片缺钙的现象[81,96]。高湿环境还影响果实蔬菜的受粉,花粉颗粒会保持或黏附在其内部[85],将降低装饰性的切花植物寿命,相反,太低的湿度条件将导致植物水分胁迫。湿度控制对作物的高产有非常重要的作用,如果没有湿度控制,可能会对作物的生长造成无可挽回的影响。

湿度控制要尽量避免极低和极高的情况,湿度或饱和蒸汽压差的控制是通过加热或通风来实现的。对于节能来说,避免太高的湿度是非常重要的,如果湿度过高,要通过升温或增加通风来除湿,这会引起更多的能耗。采用积温控制后,尽可能减少加热和通风,以免温度波动频繁。随着温度的下降,相对湿度将增加,温室空气和作物间的VPD影响作物的蒸腾作用,并且影响空气的绝对湿度。在实际应用中,相对低的湿度设定点(80-85%RH)将影响积温控制的节能效果,例如在较低温度时,为了控制湿度而不是温度,必须采用加热或通风的手段,这样会消耗更多的能量都将会影响积温的节能效果[83]。通过使用灵活的湿度控制方法,能够实现极其显著的节能效果。

在现代化的隔热温室中,积温作用导致湿度波动,甚至经常出现高湿的情况,而在高温时,VPD通常很高,因此,相对湿度很低。在实际生产中,湿度控制点的设定同积温的节能效果相互干扰,由于温室通风和加热的逐渐减少,室内温度下降,空气湿度逐渐提高。为了降低湿度,而提前加热或启动风扇,引起温室能耗增加,因此,在积温控制策略中,温室内湿度的控制特别重要,湿度控制是积温控制的一个重要影响因子。K?rnerO.等[18]以菊花切花温室为研究对象,研究了具有湿度控制域和不同温度域的温室在气候、能耗和光合作用等方面的性能,与湿度设定值为80%的温室进行了对比,由于采用了带宽为±2℃的积温控制方法,周年运行的菊花切花温室的每年能耗减少了18%,而采用±6℃带宽的积温控制,在气候波动较为频繁的春秋季节,每周的能源消耗量减少60%以上。因此,正确处理积温应用与湿度控制的关系,对防止高湿环境对作物的负面影响,以及保持积温应用的节能效果具有非常重要的意义。

积温控制是否会对作物产量和品质有影响?许多研究结果表明,应用积温控制策略不会影响作物的产量。DeKoning[90]调查了番茄果实的品质,以确定温度变动会不会对作物的品质有影响,他对番茄果实的脐腹病和果锈病发病情况进行了仔细检查,没有任何迹象表明变温对果实品质有影响;另外,他还初步调查了果实的储藏时间,也没有发现变温策略下的果实同传统控制策略下的果实之间有任何差别。Rijsdijk[95]研究了积温控制策略对玫瑰、盆栽植物和甜椒品质的影响,研究结果表明,当带宽在8℃时,温度波动略微影响盆栽作物的株高、花期或颜色,对玫瑰几乎无任何影响,会使甜椒的植株颜色变浅;当带宽≤4℃时,积温策略不影响这几种作物的品质和产量。而温度波动对其他作物的影响还需要进一步研究,但只要根据作物的生理特性,合理设定积温控制时间范围和温度界限,即便变温对作物有一定的影响,但是也会使影响程度减轻。

积温学说的出现是对温室农业节能生产的极大推动,作物的生长是由各个生育期内某段时间的温度累积所决定的,即作物允许生长环境的温度在一定的范围内波动,而且适当温差会给作物的生长带来更大受益,因此,在现代化大型温室生产中,尤其是寒冷地区的温室生产,可以充分利用作物的积温特性,减少能源消耗,降低生产成本;但是,积温控制受到湿度、差温和作物生理特性等的影响和制约,因此,要合理制定积温控制策略,协调处理各个影响因子对积温控制节能效果的影响。

北方温室在春、秋、冬季生产中,极大地受到能耗的制约,由于采用设定点跟踪调节,并没有考虑作物对能量的需求和外界自然条件的影响,温室能耗极大,约占生产成本的40%。对于大多数作物来说,它们的生长发育与精确的温度控制模式关系甚少。如果在温室环境智能控制系统中采用积温控制策略,就能充分实现节约能源的目的。

随着人们对作物的生态特性的深入研究,对温室各环境因子间相互作用关系的进一步明确,积温控制技术的发展和应用将会更趋完善,它也必将成为温室生产节能降耗的重要方法。

第四节主要研究内容

根据国内外温室环境建模及控制的研究与发展现状,针对北方温室现存的问题,本文主要展开了以下几个方面的工作:

1、建立北方温室环境模型;根据北方温室环境特点,利用神经网络的并行处理、自适应、自学习和很好的容错能力,以温室环境的温度和湿度作为输出量,建立北方温室环境春季模型;

2、以花卉温室为例,利用温室花卉的积温特性,可以大量节约能源,降低能耗,根据温室花卉的积温特性,合理解决其他因子对积温控制的影响,研究制定优化控制策略;

3、根据积温控制策略,利用神经网络构建的温室环境控制器,寻求优于传统PID控制的智能控制模式,并验证神经网络控制器的控制效果。

通过本文的研究,必将为北方温室的结构设计及生产指导产生重要的社会效益,促进北方温室的周年生产,提高生产效率和经济效益,产生深远的影响。
* 温馨提示:关注微信公众号: xiaoyida_com ,回复 xse93390 在手机上阅读完整章节!

------第二章常用网络结构及算法分析------

第一节系统辨识与建模

在理论研究中,通常所说的线性系统,实际上是对非线性系统的一种理想化或近似的描述,自然界中的系统其实都是非线性的。非线性系统具有存在多平衡点、极限环和混沌现象等特点,其动态特性与其初始状态、系统参数及输入量之间存在着复杂的非线性关系。随着控制理论在复杂控制过程中的广泛应用,受控对象的数学模型成为控制理论在实际应用中的必要的要素。但在多数情况下,受控对象的数学模型是未知的,并且其参数在正常运行过程中可能发生变化,因此,利用控制理论去解决实际问题时,首先考虑的就是建立受控对象的数学模型。

温室环境的建模是进行温室环境控制系统设计与温室结构设计的基本前提,传统的建模方法是在对温室内部环境进行理论分析的基础上,建立对象的机理模型。而温室系统是一个大滞后、时变的非线性系统,变量因子间存在有强耦合,易受到外界气候波动和内部作物的生理活动的影响,采用传统的建模方法很难建立其准确数学模型。现有的数学模型是在一些假设、简化后得到的,多为一阶、二阶惯性滞后环节,这样的简化模型精度不高,难于满足控制系统的需要。

建立系统数学模型的方法有机理分析法、系统辨识建模、机理分析和系统辨识相结合的建模方法。机理分析法也称为白箱建模,是根据系统的结构,分析系统的动态规律,利用已知的定理或原理,如能量平衡方程、传热传质原理等推导出系统的数学模型;系统辨识(SystemIdentification)是根据系统的输入输出数据建立系统数学模型的理论和方法,也称为黑箱建模问题,系统辨识包括确定系统数学模型结构和估计数学模型参数;机理分析法和系统辨识法相结合的方法也称为灰箱建模,适用于系统的动态规律不是完全未知的情况。不管采用哪种建模方法,都必须首先弄清待辨识对象的层次及其周围的环境条件,明确模型应包含的变量,一个过程的变量可能很多,模型中究竟应该包括哪些变量完全取决于建模目的,应该只包括对建模目的影响比较显著的变量,影响不大的变量不应该包括在内,以免模型过于复杂,而失去其实用价值。建立数学模型时,一般需要遵循以下基本原则:目的性、实用性、灵活性、算法的复杂性、可辨识性、准则函数特性和节省性等。

Zadeh对系统辨识所下的定义为[113]:辨识就是在输入和输出数据的基础上,由规定的一类系统模型中确定一个系统模型,使之与待辨识系统等价。这个定义明确了辨识的三个基本要素:合适的模型类,能够从中选出一个合适的模型,能在某种期望的程度上代表被辨识的系统,模型类可以是确定型模型或随机模型,也可以是线性模型或非线性模型等;要有合适的观测数据,观测数据可通过对具体对象进行实验得到,要能充分反映系统特性,一般要求在满足系统约束的前提下,尽可能使观测数据具有最大信息量,这是系统的充分激励问题;要有合适的评价准则,即辨识的优化目标,作为从模型类中确定一个合适模型的准则,使之能更好地拟合当前观测数据。其中,数据是辨识的基础,准则是辨识的优化目标,模型类是寻找模型的范围。

从实用角度来说,辨识就是按照某种准则从一组模型中选择一个与数据拟合得最好的模型,也就是使这个模型能更好地拟合由系统输入输出观测数据体现出的实际系统的静态或动态特性。通常,对象的输入输出信号总是能够测量得到的,而对象的动态特性必然隐含在这些观测数据之中,因此,对象模型可以通过输入输出数据所提供的信息来建立。目前,辨识线性、非时变和具有不确定参数的系统的研究已取得了很大的进展,对于非线性系统的辨识问题,通常需要有关待辨识系统的各种先验知识和假设,因此,它们基本上是针对某些特殊非线性系统而进行的。神经网络模型是一种黑箱模型,神经网络具有非线性变换特性和高度的并行运算能力,具有自学习能力,适合于复杂系统建模,为非线性动态系统的辨识提供了一条十分有效的途径。

第二节神经网络模型辨识

神经网络辨识同基于算法的辨识一样,需要有模型、数据和误差准则。模型的选择要注意兼顾复杂性和精确性的矛盾,反映在神经网络结构上就是隐层数及其节点数的确定,目前尚无较好的理论指导;输入信号的选择要注意量和质的问题,要保证数据点的数量,使之能够持续激励系统的动态过程,同时注意信号中的噪声对网络模型精度的影响;误差准则的选择要保证能够区分模型接近系统特性的程度,可以根据不同的问题,选择不同的误差函数,常用的误差准则是输出误差的泛函。

神经网络模型辨识中常用的结构有正向建模和逆向建模的结构,正向建模中分为串-并辨识的结构及并联辨识结构,逆向建模分为直接逆向辨识结构和特殊逆向辨识结构。神经网络辨识系统就是根据模型、系统过程的输出误差,利用网络算法调节网络的参数,直到模型参数收敛到它们的期望值。

如果神经网络训练过程是用来表示系统的正向动态特性,这种建模方法就称为正向辨识建模,其结构如图2-1所示,图中TDL为具有抽头的延时线,神经网络与系统并行,神经网络与系统的输出误差作为网络训练信号,这种结构也称为串-并辨识模型。学习方法是有监督的,系统输出直接为神经网络提供目标值,通过网络将预测误差直接反传进行训练。设被辨识系统具有以下形式:

输出作为NN2的输入,NN2的输出和系统的输出之差用来调节NN2的权值,用系统的输出和系统输出期望值之差调节NN1的权值,这种网络结构称为正-逆建模结构,NN2为正向辨识建模网络,NN1为逆控制器。

第三节温室建模中常用网络结构

神经网络用于系统辨识的实质就是选择一个适当的神经网络模型,按照某种准则,使之能更好地逼近实际系统的动态或静态特性。从网络基本模式结构来看,辨识常用的网络类型主要有:前向型网络、反馈型网络、自组织型网络和随机型网络等。在本节将阐述温室建模中常用的网络结构及其算法,并分析其特点以及优化方法。

一、多层感知器(MLP)

多层感知器(MLP,MultilayerPerceptrons)是由输入层、隐含层(一层或多层)和输出层构成的神经网络,输入层神经元的个数就是输入信号的维数,隐含层和隐节点的数量视具体情况而定,输出层神经元的数量为输出信号的维数,由可调权值将相邻层之间连接起来。网络每一层的神经元只含有它们前一输入层的输出信号,即前一层的输出作为下一层的输入,各神经元之间没有反馈,因此,把这类网络结构称为前向神经网络,如图2-5所示。通过对给定的输入、输出数据集的训练得到的前向网络,可以看作是一种将一组输入模式变换到一组输出模式的系统变换。为了能够实现这一目的,网络的可调权值阵在某种学习规则的指导下,通过一组输入输出样本集的训练,进行自适应学习,因此,这种学习方法又称为有导师监督下的学习。

在前向网络中,通过著名的误差反向传播(BP,BackPropagation)学习算法进行网络权值的学习和调整,多层感知器也常常被称为BP网络。

BP算法学习过程包含工作信号正向传播和误差信号反向传播两个过程。在正向传播过程中,输入信号从输入层经过隐单元层处理,传递到输出层,在信号向前传递过程中网络权值是固定不变的,每一层神经元的状态只影响下一层神经元的状态。如果输出层不能得到期望的输出,则进入误差信号反向传播过程。在误差信号反向传播过程中,误差信号由输出端开始逐层向前传播,各层神经元的权值按误差函数的负梯度方向进行调节,最终使网络输出与期望输出之间的误差趋向最小。因此,BP算法是一种以梯度为基础的搜索算法,在算法的实现上,充分体现了神经网络并行处理的特点。

前向网络权值的学习和训练是通过使期望输出与实际输出之间的误差趋近于极小来进行的。BP算法有两种训练网络方式:顺序方式,每输入一个训练样本,修改一次网络权值,这种方式需要的临时存储空间较小,有利于权值空间的随机搜索,在一定程度上可以避免学习陷入局部极小,但收敛条件难以建立;批处理方式,用组成一个训练周期的全部样本一次输入网络进行训练,每个训练周期重新对此样本集进行训练,以总的平均误差能量作为学习目标函数,进行网络权值的修正,该方式能精确计算出梯度向量,误差收敛条件简单,易于并行处理。

BP算法的训练思想和计算公式如下[114]:

训练思想是:对网络权值与阈值进行修正,使误差函数(E)沿负梯度方向下降。以3层BP网络为例,其各层的节点表示为:输入节点Xi,隐节点Hj,输出节点Op。

设输入层有I个输入信号,其中任一个输入信号用i表示;隐层有J个隐神经元,其中的任一神经元用j表示;输出层有P个神经元,其中任一神经元用p表示。wij表示输入层与隐层的连接权值,wjp表示隐层与输出层的连接权值。设训练样本集为X=[X1,X2,…,XN],对应任一训练样本Xk=[Xk1,Xk2,…,XkN]T(k=1,2,…,N)的实际输出为Ok=[Ok1,Ok2,…,OkP]T,期望输出为dk=[dk1,dk2,…,dkP]T,n为迭代代数,权值和实际输出是n的函数。

由工作信号的正向传播过程可得:

(1)选定学习速率η(0

(2)训练开始,随机输入样本,并按公式(2-3)和(2-4)计算各隐神经元的输出和各输出神经元的输出;

(3)计算误差E(t)←[(dk-Ok)2/2]+E,k=1,2,……no;

(4)按公式(2-5)计算广义误差;

(5)按照公式(2-17)和(2-19)调整权值矩阵;

(6)若t

(7)若E

BP算法的使用很广泛,但仍存在一定的不足,主要有:

(l)目标函数存在局部极小点。BP算法本质上是梯度算法,是求解误差函数的最小值问题,它采用非线性规划中的最速下降法,按误差函数的负梯度方向修改权值,就必然会存在局部极小问题,当前解是否最优,还没有理论和方法可依;

(2)学习算法的效率低,收敛速度慢,其收敛速度与初始权值的选择有关,为避免每一步权值的调整方向是同向的,即权值同时增加或同时减少,网络的初始权值应取为小的随机数;

(3)网络的隐层数及节点数的选择,目前尚无理论指导,只是有些经验公式做依据,但是不同的问题还需要具体解决,如果网络训练后的结构不够理想,只有重新对网络进行训练,直到得到满意的结果为止;

(4)网络的泛化能力和适应能力较差。

针对BP算法收敛速度慢的缺点,提出了在上述BP学习算法中加入动量因子的加速收敛学习算法。在上述的BP算法中,学习步长η的选取很重要,η值大则网络收敛快,但是过大会引起不稳定,η值小可以避免不稳定,但收敛速度慢。解决这一问题的最简单方法是加入动量因子,即令

由上式可知:

(1)本次修正量是一系列加权指数序列的和,当动量因子满足,序列收敛,当α=0时,上式不含动量项,理论上α可为正数或负数,但是实际应用中不可能取负数;

(2)当本次的与前一次同符号时,其加权求和值增大,使较大,从而在稳定调节时加快了权值w的调节速度;

(3)当本次的与前一次符号相反时,指数加权求和结果使减小,起到了稳定作用。

在BP算法中加入动量因子不仅可以微调权值的修正量,也可以使学习避免陷入局部最小。

杜尚丰等[49]采用BP网络建立了温室温度预测模型,比较了输入和输出延迟时间选择的不同,对所得结果的精度的影响差别,并确定了合适的模型延迟时间,建立了5-10-1结构的BP模型,温度预测误差控制在±1.5℃内。Borhan等[27]在番茄温室环境预测建模中,采用了带动量项的BP网络,网络结构为12-6-3,输出为温室内的温度、湿度和日照,共训练了500步,并将预测结果与作物表面温度动态模型的输出结果做了对比,BP网络预测温度、湿度、日照的平均精度分别为99%、97%、78%,作物表面温度动态模型的平均精度分别为98%、95%、63%,其中日照受到遮阳网的影响,较难预测,随着预测时域的增加,BP预测模型的精度将增加,并且比作物表面温度模型的适用面更广,更便于优化。由上述温室气候建模案例可见,温室气候的神经网络建模具有传统数学建模所无法比拟的优点,神经网络建模不需要温室对象模型的阶,不需要对温室内部的复杂机理和作物对象的生理活动进行分析,只需要用到对象的输入和输出数据,具有更加便于优化和更高的精度的特点,但是,这种黑箱模型具有无法解释的特点,其网络权值难以用具体的物理意义加以解释,而且BP网络自身的缺陷依然存在。

二、RBF网络原理及常用算法

径向基(RBF,RadialBasisFunction)神经网络是一种常用的3层前向网络,由于径向基神经网络具有结构简单、训练简洁、收敛速度快、能够逼近任意非线性函数等特点,因此,在建模和控制中得到较为广泛的应用。

RBF网络最显著的特点是隐节点的基函数采用距离函数(如欧氏距离),并使用径向基函数作为激活函数,径向基函数可以取多种形式,如:

RBF网络是采用对中心点径向对称且衰减的非负非线性径向基函数作为隐单元的“基”,构成隐含层空间,隐含层通过对输入向量进行变换,将低维模式的输入数据变换到高维空间内,使得在低维空间内的线性不可分问题在高维空间内线性可分。

RBF网络是单隐层的前向网络,由三层构成:输入层、隐含层和输出层,隐单元的数量由所描述的问题而定,根据隐单元数量的不同,RBF网络有正规化网络(RegularizationNetwork)和广义网络(GeneralizedNetwork)两种模型。正规化网络的隐单元是由训练样本构成,所以,它具有与训练样本相同数量的隐单元个数,训练样本数量很大时,网络的实现复杂,且在求解网络权值时容易产生病态问题(illconditioning),因此较少采用。常用的是广义网络,它采用Galerkin方法来减少隐层神经元的个数。假设训练样本有N个,广义网络总是试图从训练样本中选出I(I

RBF网络要学习的参数有三个:基函数的中心和扩展常数以及输出层权值。根据径向基函数中心选取方法的不同,RBF网络设计方法可以分为两大类[116]:

(1)数据中心从样本输入中选取

在这种方法中,如正交最小二乘(OLS,OrthogonalLeastSquare)算法、正则化正交最小二乘(ROLS,RegularizedOrthogonalLeastSquare)算法、进化优选算法等,这类算法的特点是从样本输入中选取数据中心,数据中心一旦获得就不再改变,而隐节点的数目或者一开始就固定,或者在学习过程中动态调整。

(2)数据中心动态调节方法

在这类方法中,数据中心的位置是在学习过程中动态调节的,如各种基于动态聚类方法,常用的有k均值聚类、自组织特征映射(SOFM,Self-OrganizingFeatureMapping)方法、梯度训练法、资源分配网络(RAN,Resource-AllocatingNetwork)、资源优化网络(RON,ResourceOptimizingNetwork)等。

这些方法各有优缺点,第一类方法较容易实现,而且能在权值学习的同时确定隐节点的数目,并保证学习误差小于给定值,但数据中心从样本输入中选取是否合理,值得进一步讨论,另外,OLS算法无法确定基函数的宽度,也并不一定能设计出具有最小结构的RBF网络;在第二类方法中,聚类方法的优点是能根据各聚类中心之间的距离确定各隐节点的扩展常数,缺点是确定数据中心时只用到了样本输入信息,而没有用到样本输出信息,另外聚类方法也无法确定聚类数目,即RBF网的隐节点数。由于RBF网的隐节点数和中心对其泛化能力有极大的影响,所以,用聚类方法设计RBF网络时,首先需要解决的问题是寻找能确定聚类数目的合理方法。

OLS算法具有计算量小、运算速度快、能够自动找到较小的网络结构的特点,应用较为广泛,下面介绍正交最小二乘算法的原理和步骤。

正交最小二乘法是由Chen等人提出的,数据中心从样本输入中选取,算法思路是:令各扩展常数取相同值,把所有样本输入均选作数据中心,根据Michelli定理,隐层输出阵H是可逆的,于是可以由H的N个列向量线性表示目标输出d。每做一次运算,计算一个能量值,H的N个列向量对输出的能量贡献显然不同,因此,可以依据能量贡献大小,从H的N个列向量中依次找出M≤N个列向量构成∈RN×M,随着运算次数的增加,网络的输出能量误差逐步减小到指定的精度范围内,直到满足给定误差δ,即

式(2-29)中的各xi是相互正交的,而H的各列并不正交,因此正交最小二乘算法对H的列的选择是在对H作Gram-Schmidt正交化的过程中实现的。

Gram-Schmidt正交化选择数据中心的步骤如下:

(1)计算各隐节点输出,构成隐输出阵H,并由其N个列向量,,…,,构成N维欧氏空间;

(2)把输出矢量Y投影到,,…,上,计算各个投影角,如果Y与某一隐输出有最大的投影角,即的绝对值最大,该隐输出对Y的能量贡献最大,则把对应的输入作为第1个隐中心,构成一维欧氏空间E1;

(3)用伪逆法计算网络的输出权值和偏移量,并计算网络的训练误差,如果误差小于容许误差则终止算法,否则对前一步中剩下的向量继续进行正交化,使之正交于E1,得到新的隐输出,,…,;

(4)计算新的隐输出阵中与Y有最大投影角的,把对应的输入作为第2个数据中心,计算网络输出权值及训练误差,并判断是否终止运算;

(5)重复(1)~(4),直到找到M个数据中心,使网络的训练误差小于给定值。

网络的隐节点数就是计算步数m,隐节点中心是[Xi1,Xi2,…,Xim],它们分别为每次计算时相应能量误差最大的输入样本,网络权值矩阵由式AW=g计算,其中



由上述可知,OLS算法的主要思想是选择隐输出阵H的若干列的线性组合,来逼近教师信号,且逼近误差小于设定误差值。

余朝刚等[53]以当前时刻室外湿度、风速、太阳辐照度、顶窗开度、内帘幕展开度、水温、室内温度、相对湿度,再加上1个和2个时间间隔以前的室内温度作为输入向量,采用RBF网络和OLS算法建立室内温度一步预测模型,得到了满意的预测精度(均方差为0.0073)。OLS算法相对于BP算法,具有计算量小、网络训练速度快、能够得到较简单的网络结构等特点。

OLS算法实现的关键是从H中选择合适的列,虽然OLS算法采用了Gram-Schmidt正交化方法,能够找到较小的网络结构,但是不一定能找到最小的网络结构。选择最优的隐输出的列是一个组合优化问题,而OLS算法只是相当于采用“最大投影法则”的一种启发式算法,因此,不能保证找到最优的列。如果改变正交化次序,则每个数据中心的能量贡献将发生改变,所以,神经网络的逼近误差只与选择哪些数据中心有关,而与数据中心被选择的次序无关。因此,我们可以采用优化算法寻找最优的网络结构。

三、支持向量机模型

支持向量机(SVM,SupportVectorMachine)是Vapnik等人在统计学习理论基础上提出的一种模式识别的新方法,在有限样本的情况下,找到模型的复杂性和学习能力之间的最佳折中,从而获得最好的泛化能力。支持向量机在形式上类似于多层前向网络,而且也被用于模式识别和非线性回归,但是,支持向量机方法能够克服多层前向网络的固有缺陷,具有以下优点:

(1)它的目标是找到有限样本信息下的最优解,而不仅仅是在无穷大样本数时的最优解;

(2)算法最终将转化成为一个二次型寻优问题,在理论上能够得到全局最优点;

(3)算法通过非线性变化将实际问题转换到高维特征空间,在高维空间中构造线性判别函数,从而实现原空间中的非线性判别函数,保证机器有较好的泛化能力,同时解决了维数问题,使得其算法复杂度与样本维数无关。

MLP和RBF网络都存在着网络结构确定问题、过学习(overfitting)问题及局部最小点问题等,实质上,这就是由于理论上需要无穷样本与实际样本有限的矛盾造成的。

机器学习的目的就是在给定的训练样本中找出系统输入和输出之间依赖关系的估计,使机器能够对未知输入的输出作出尽可能准确的预测。因此,通过定义期望风险函数(RiskFunction)来对学习效果进行评估。假定有n个相互独立并服从同一分布的数据样本,设系统在给定输入为X时的输出为Y,且输出变量Y与输入变量X之间存在某种未知关系,遵循未知的联合概率分布F[X,Y],则机器学习的期望风险定义为,其中{f(X,w)}为预测函数集,L(Y,f(X,w))为损失函数。

为了达到使期望风险最小的学习目的,就必须依赖于联合概率F[X,Y],但是,期望风险在实际的机器学习问题中是未知的,只能利用已知训练数据集的信息,因此,无法直接计算期望风险,并进行最小化。在实际应用中,通常根据大数定理,采用算术平均来代替期望风险,利用求经验风险的最小值来代替求期望风险的最小值,即为经验风险最小化原则(ERM,EmpiricalRiskMinimization),它是目前绝大多数模式识别方法的基础。

Vapnik等人经过研究,针对两分类问题,提出了以下结论,对指示函数集中的所有函数,经验风险和实际风险之间以一定的概率满足如下关系[114]:

式中,l是样本数,h是函数集的VC维,VC维是衡量学习机器复杂程度的一个指标,VC维越大,网络结构越复杂。

由式(2-34)可见,学习机器的实际风险由经验风险Remp(w)(即训练误差)和置信范围两部分组成。为了更清楚地描述置信范围与学习机器的VC维和训练样本数l的关系,将置信范围简写为Φ(h/l)的形式。

过学习问题是指网络的训练误差在减小,而其泛化误差在增加,泛化能力在下降,这主要是因为训练样本不充分或网络结构设计不合理引起的。VC维h太大,导致Φ(h/l)很大,虽然这时训练误差为0,但是由式(2-34)可知,最终得到的实际风险仍然很大,所以其泛化能力很差。

为了解决这个问题,就需要在减小训练误差的同时,降低网络结构的复杂度,从而控制网络在整个样本集上的期望风险,这就是结构风险最小化(SRM,StructuralRiskMinimization)原则的基本思想。它的基本思路是:首先构造一组嵌套的函数子集,使其复杂度由内向外依次递增,然后在该嵌套子集范围内找到一个子集,该子集能使训练误差Remp(w)和置信范围Φ(h/l)的和达到最小,从而最小化实际风险上界。显然,利用SRM原则的思想,就可以妥善解决神经网络的过学习和过拟合问题,SVM方法实际上就是SRM原则思想的具体实现。

支持向量机最初是用来解决模式识别的问题,在模式识别中,为了发现具有好的推广能力的决策规则而选择的一些训练数据的子集,称作支持向量,最佳的支持向量分离等效于所有数据的分离。支持向量机是从线性可分情况下的最优分类面发展而来的。最优分类线就是要求分类线不但能将两类正确分开,而且使分类间隔最大,如图2-8所示,实心点和空心点分别代表两类样本,H为分类线,H1、H2分别为过两类中离分类线最近的样本且平行于分类线的直线,经过H1和H2的样本即为支持向量。推广到高维空间,分类线即为分类面。

式中,称为核函数,它是满足Mercer条件的任何对称的核函数,对应于高维特征空间的点积,核函数的形式有很多,如多项式函数,径向基函数,Sigmoid函数等。

支持向量机回归的建模步骤如下:

(1)选择适当形式的支持向量机模型。上述的f(x)是从样本数据中在线建立的线性模型,支持向量机回归算法中需要选择的参数主要有核函数、损失函数和容量控制。核函数有多种形式,通过比较各种形式核函数的VC维的上界,从中选择一个最适合的核函数,这种方法主要是应用在非线性特征空间中计算包含数据的超平面的半径,通常采用交叉验证的方法来选择核函数。除了需要选择核函数以外,慎重选择核的参数也是很重要的,如果有充足的数据,可以采用Cross-validation的方法得到其参数。损失函数的选择主要是根据针对实际问题的模型的特点来进行。容量控制在某些情况下直接与待调整的参数和数据中的噪声有关,因此,选择容量控制时,要考虑数据中的噪声影响;

(2)初始化,选用m个数据点建立系统模型;

(3)根据实际问题的需要,预测未来n步输出数据yp(m+1),yp(m+2),…,yp(m+n);

(4)计算偏差,计算出预测输出数据与实测输出数据y(m+1),y(m+2),…,y(m+n)之间的误差e(m+1),e(m+2),…,e(m+n);

(5)如果e

(6)将采集到的新数据点增加到上述初始模型中计算得到的支持向量集合里,重新建立模型;

(7)转向步骤(3)。

王定成[5]采用支持向量机回归算法建立温室温度预测模型,从历史数据中回归温室温度变化,以径向基函数为支持向量机核函数,二次型损失函数作为损失函数,径向基函数的扩展常数为83,容量控制为∞,在实验预测过程中,没有考虑外界的气候因素如光照强度、风速、以及传感器噪声等的影响,预测的平均误差为0.1288℃。该方法为一种较新的温室建模方法,能够得到较好的预测误差,但是,其算法中的待定参数较多,没有很好的选择依据,需要优化算法的支持。

第四节常用优化算法

优化算法本质上就是一种搜索规则或过程,它是以某种机制和思想为基础,通过一定的规则或途径来得到用户问题的最优解。智能优化算法也是一种迭代算法,是通过揭示或模拟某些自然过程或现象而来的,是以一组解(种群)作为迭代的初始值,对问题的解进行编码,映射成为可进行启发式操作的数据结构,只用到优化问题的目标函数值的信息,不必使用目标函数的导数信息。搜索策略是随机化或结构化的,具有全局的和并行高效的优化性能、鲁棒性和通用性强等优点。智能优化算法的适用范围非常广泛,特别适用于大规模的并行计算。

进化策略(ES,EvolutionaryStrategy)、进化规划(EP,EvolutionaryProgramming)和遗传算法(GA,GeneticAlgorithm)三者一起构成了进化计算的主要框架,它们都具有较好的全局搜索能力,因此,比较适用于寻找最佳的神经网络结构或参数。

一、遗传算法

遗传算法起源于对生物系统所进行的计算机模拟研究,是Holland教授及其学生们受到生物模拟技术的启发,研究出的一种基于生物进化机制的、适合于复杂系统优化计算的自适应概率优化技术。

遗传算法的基本要素包括[117]:编码,初始种群的产生,适应度函数的设定,遗传算子(选择算子、交叉算子、变异算子)、终止条件和运行参数设定等。编码是将不能直接解决的问题表示成遗传空间的基因型串结构数据,在进化开始前,准备一个由若干初始解组成的初始群体,根据适应度函数,计算出种群中个体的适应度,以区分个体的好坏,适应度函数主要由目标函数映射而成的,选择运算的目的是以一定的概率从当前种群中选择优良的个体,作为父代繁殖后代,交叉运算是通过对两个染色体之间的交叉重组形成新的染色体,变异运算使染色体某一基因发生变化,产生新的染色体,表现出新的性状,终止条件就是遗传进化结束的条件。遗传算法中的基本运行参数主要有群体规模、交叉概率和变异概率等。

标准遗传算法的流程如图2-10所示,

图2-10标准遗传算法流程图

Fig.2-10StandardGAflowdiagram

(1)令初始进化代数为0,然后将问题的每一个解编码为一个染色体,由这些染色体构成初始种群,初始种群中的每个个体都是随机生成的;

(2)按照目标函数映射成的适应度函数,计算种群中的每个个体的适应度;

(3)根据选择准则和每个个体的适应度值进行选择复制操作,低适应度值的个体将被从种群中淘汰,高适应度值的个体将被复制;根据交叉概率和交叉准则,从初始种群中选择两个优良个体,并对这两个个体完成交叉操作;根据变异概率和变异准则,对部分染色体的部分基因进行变异操作,产生新的个体,由选择、交叉、变异操作得到新一代群体,进化代数加1;

(4)判断终止条件是否满足,如果终止条件满足,则算法转到步骤(5),否则,转到步骤(2);

(5)群体中的最好个体或整个进化过程中的最好个体作为算法的最优解输出。

由上述可见,遗传算法流程很简单,选择、交叉和变异是遗传算法的3个主要操作算子,它们使遗传算法具有了与其他传统方法所不同的特性。遗传算法中包含了以下5个基本要素:参数编码;初始种群的设定;适应度函数的设计;控制参数设定,主要是指群体大小和使用遗传操作的概率等;遗传操作设计。

遗传算法是一种简捷的和容错性强的鲁棒搜索算法,可用于复杂系统的优化计算,特点如下:

(1)搜索过程不是直接作用在变量上,而是作用在对优化问题解集进行了编码的个体上,遗传算法通过编码操作可直接对结构对象进行优化操作;

(2)搜索过程具有本质的并行性,它是从一组解迭代得到另一组解,采用同时处理种群中多个个体的方法;

(3)遗传算法具有全局最优搜索性,它可以在整个解空间中同时进行搜索寻优,可以有效地避免搜索陷入局部极小点;

(4)只以决策变量的编码作为运算对象,对搜索空间无任何特殊要求;

(5)具有极强的容错能力,通过遗传操作算子能快速排除和最优解相差极大的个体;

(6)是采用随机方法进行最优解的搜索。

遗传算法的缺点如下:

(1)容易出现早熟收敛现象。因为遗传算法只是依据适应度来确定解的优劣,当种群中某个个体的适应度值较大时,它的基因就会在种群中迅速繁殖扩散,造成种群过早失去多样性,个体解的适应度停滞,搜索陷入局部极值点,无法找到全局最优解;

(2)局部搜索能力不足。遗传算法具有优异的全局搜索能力,而局部搜索能力不足,这导致GA在进化后期,收敛速度减慢,甚至无法搜索到全局最优解;

(3)遗传算子操作的随机性。在遗传算子中,选择操作可以保证选择的都是优良个体,但是变异操作和交叉操作只是引入了新个体,但并不保证它们是优良个体,如果新个体不够优良,这些新个体就会成为干扰因素,反而会阻碍GA的进化速度。

在神经网络结构设计时使用遗传算法最佳的方式是结构与权同时进化,当神经网络规模较大或权参数较多时,这种方法是极为耗时的。另外,权参数的编码精度较难确定,当精度过高时,染色体过长,计算时间会迅速增加;当精度过低时,则不能精确定位权参数的值。

李秀梅等[45]采用改进遗传算法的模糊神经网络控制器控制温室的温度和湿度,在遗传算法中采用智能变异,使搜索过程不易陷入局部极值点,能在全局范围内快速找到最优解,利用该遗传算法优化温室系统的辨识模型,通过仿真实验得到,辨识模型的最大相对误差为7.8%,最小误差为0.2%。

二、进化策略

进化策略可以分为二元进化策略(two-memberevolutionstrategy)和多元进化策略(multi-memberevolutionstrategy)。二元进化策略是进化策略中最简单的一种形式,它只考虑变异和选择两个自然进化过程。其对优化问题的进化过程可以描述如下[118]:

(1)初始化。根据工程问题生成一个优化问题的两个解,这两个解代表n维欧氏空间中的两个点,由于它们位置的不同,决定了其对应目标函数值的不同,其中目标函数值较高的解将参与下面步骤的运算,这是第1次迭代;

(2)变异。在第k次迭代中,根据被选择的解xk,产生一个新解yk,xk与yk只是在n维欧氏空间中的位置不同,它们所对应的点之差是一个随机向量;

(3)选择。xk与yk对应于目标函数F(x)分别具有不同的函数值,其中只有具有较高目标函数值的解被选择参与第k+1次迭代中的运算。

并令k=k+1,如果算法不满足终止条件,则转到(2)。

在上述算法中,z(k)的选取体现了变异过程的特性,根据变异过程的特点,要求z(k)是均值为0、方差较小的随机向量。可以取z(k)为正态分布,单变量的正态分布概率密度函数为

式中,μ和σ分别是均值和方差。对于多元变量的正态分布概率密度函数为

式中表示多元随机变量,μ是均值向量,C是协方差矩阵,n是向量的维数。由于要求向量的n个分量是彼此独立的,每个分量是零均值的,协方差矩阵C可以写为下面的对角阵

r是一个常数,表示一个超椭球面,当σi=σ时,式(2-41)表示的是一个超球面,所以,式(2-39)表示的等概率密度曲线是一个超椭球面,而式(2-40)表示的是一个超球面。因此,变异过程的几何意义为:对于给定的一个解x所做的变异就是在该解位置附近选取的另一个新解,在x附近的所有解中,距离x越近的,被选取的可能性就越大,而在以x为中心的超球面内的每个解被选择的可能性相等。

在算法迭代中,步长的选择方法会影响到算法的性能,特别会影响到算法的收敛速度,为达到最高的收敛速度,步长的改变应该遵从1/5成功律[118],即在迭代过程中,计算与最大值靠近的次数和总的迭代次数的比值,如果比值大于1/5,则增大步长,否则,减小步长。在实际应用中通常是在每n次迭代之后,计算前10n次迭代中解变好的次数,如果该值小于2n,则步长乘以0.85,否则,步长除以0.85。

迭代的结束通常是以算法不再能够找到更优解为准则,而在实际应用中,需要在每次迭代循环中指示是否结束迭代。因此,在实际应用中常用的一个结束规则是:如果变异步长已经非常小或每次迭代生成的解与原解相比差异很小,就认为算法不再可能得到性能更好的解,算法停止。但是,这一准则并不能保证找到极值点。在算法实现中,常常提前确定一个最大迭代代数,如果算法的迭代次数超过最大迭代次数,则算法停止。因此,这个条件成为算法收敛准则以外的附加准则,这种方法的优点是避免因原收敛准则不满足而执行太多次迭代,它能够有效地限制算法的运行时间。

在进化策略中,只采用了变异和选择操作,而不采用遗传算法中的交叉操作,非常适合于RBF网络数据中心的优化选择。

三、粒子群优化算法

粒子群优化(PSO,ParticleSwarmOptimization)算法是一种高效的并行搜索算法,是基于群体智能理论的全局优化方法,通过群体中粒子间的合作和竞争产生的群体智能指导优化搜索。

在PSO算法中,每个优化问题的解被看作为搜索空间中的一个粒子,所有粒子根据目标函数都有一个对应的适应度值,还有一个决定它们飞行的方向和距离的速度。粒子群优化算法根据优化问题,初始化产生一群随机粒子作为初始种群,粒子根据对个体和种群的寻优情况的综合分析来动态调整自己的速度,搜索整个解空间,通过迭代寻找到最优解。在每次迭代过程中,粒子通过跟踪个体最优值pbest和全局最优值gbest来更新自己的速度和位置,个体最优值就是粒子个体当前找到的最优解,全局最优值是整个种群当前寻找到的最优解。当粒子找到个体最优解和全局最优解时,按照下面公式更新自己的速度和位置[119]:

粒子群优化算法步骤如下:

(1)令初始进化代数为0,每个优化问题的解看作搜索空间中的一个粒子,在解空间中随机生成一群粒子,构成初始种群,每个粒子都有初始速度和位置;

(2)按照目标函数映射成的适应度函数,计算种群中的每个个体的适应度和群体适应度;

(3)计算每个个体的最优位置和群体的最优位置,根据表达式(2-42)和(2-43)更新个体速度和位置;

(4)判断终止条件是否满足,通常采用迭代次数是否大于最大循环次数,或误差是否小于最小误差阈值作为终止条件,如果终止条件满足,则算法转到步骤(5),否则,转到步骤(2);

(5)输出寻优结果,将找到的最优个体输出。

粒子群优化算法中的主要参数包括:粒子数、粒子长度、粒子的范围、参数c1、c2、r1和r2、终止条件等。粒子群算法对种群大小不十分敏感,一般取粒子数20~50,粒子长度和范围由优化问题而决定,参数c1和c2对算法的收敛性影响不大,合适取值可以加快算法的收敛速度,其值通常不超过4,参数r1和r2用于保证群体的多样性,取[0,1]之间的随机数,PSO算法常以最大迭代次数或最小误差阈值作为终止条件。

粒子群优化算法的特点:

(1)PSO算法具有本质的并行性,搜索过程是从一组解迭代到另一组解,采用同时处理群体中多个个体的方法;

(2)PSO算法算法简单,易于实现;

(3)各粒子的搜索具有随机性,可搜索确定或不确定的复杂区域;

(4)PSO算法具有有效的平衡全局和局部搜索的能力,避免早熟现象的发生;

(5)具有学习功能,在进化过程中每个粒子能根据自身经验和群体经验更新坐标;

(6)解的质量不依赖于初始解的选择。

PSO算法可以用于RBF网络参数的寻优,优化网络结构,在下面章节将具体介绍。

CoelhoJ.P.等[72]采用粒子群优化算法设计了基于模型的温室温度预测控制系统,利用粒子群算法较强的全局和局部搜索能力优化预测控制器的参数,以解决温室温度控制器的二次规划问题,并与遗传算法进行了性能对比,实验结果表明:PSO算法能够减小跟踪误差接近30%,而遗传算法能够减小跟踪误差接近27%,并且PSO算法能够减少加热和通风的控制动作,降低执行器的动作频率,节能效果和控制精度均高于遗传算法优化的预测控制器。

第五节本章小结

温室系统是一个具有多变量、大延迟、时变的复杂非线性系统,采用机理法只能得到其简化模型或近似线性模型,难以建立其准确的数学模型。而神经网络具有并行学习、自适应能力和非线性逼近能力等特点,适合于解决复杂的非线性系统建模问题,因此,在温室环境建模中广泛采用神经网络建模技术。

在温室环境建模中常用的网络结构有BP网络、RBF网络和支持向量机等,BP网络具有目标函数存在局部极小点、学习效率低、泛化能力和适应能力差的缺点,而且网络的隐层数和隐节点数的选择,无理论指导。支持向量机模型存在待定参数多,需要采用优化算法优化模型参数。RBF网络有良好的生物学基础和数学基础,具有结构简单、训练简洁、收敛速度快、能够逼近任意非线性函数等特点,输出层为线性输出,输出和权值计算快,因此,本文采用RBF网络作为温室环境模型结构。RBF网络结构中需要确定参数有隐节点数、隐中心、扩展常数和权,网络结构和参数的优劣直接影响着网络模型的性能,因此,常常采用优化算法对其结构和权进行全局优化。

常用的优化算法有遗传算法、粒子群算法和进化策略,遗传算法具有全局最优搜索、本质的并行性和极强的容错能力等优点,但是,它容易出现早熟现象,局部搜索能力不足,遗传算子操作具有随机性,可能会阻碍搜索速度。粒子群算法简单、易于实现,能够平衡全局和局部搜索能力,避免早熟现象的发生,解的质量不依赖于初始解的选择,因此,本文采用粒子群算法优化RBF网络的扩展常数和正则化系数,以简化网络结构和抑制噪声数据。进化策略具有全局搜索、收敛速度快等特点,其进化算子只有选择和变异操作,适合RBF网络隐中心的寻优操作,因此,本文将采用进化策略在样本集内全局寻优隐中心,使RBF网络结构更简单,增强其泛化能力。未完待续......欲知下回,请关注微信公众号: xiaoyida_com ,回复 xse93390 获取完整内容!
----------
本小说内容节选自:人文社科小说 《基于RBF网络的北方温室环境控制机理的研究》

作者:赵斌
最后更新于:2016年09月08日
----------
温馨提示:如何阅读完整内容?
方法一:点击下方 “阅读原文” 链接去读小说“基于RBF网络的北方温室环境控制机理的研究”后续完整章节!
方法二:关注微信公众号: xiaoyida_com (优美小说节选),回复 xse93390 阅读后续完整章节!


    关注 小意达


微信扫一扫关注公众号

0 个评论

要回复文章请先登录注册