一、基于神经网络的自学习模糊控制(论文文献综述)
赵毓[1](2021)在《多智能体系统自主规避任务决策方法研究》文中研究说明随着航空航天事业的高速发展,越来越多的飞行器采用群体或多体协同的方式执行任务,呈现出典型的多智能体特征,适于使用多智能体理论对其进行分析和建模,对分布式自主决策技术的需求日益突出。飞行器自主规避是确保其安全性最直接有效的方法,但是当前对相关技术的研究多是基于静态全局规划算法,难以满足动态场景中多实体间实时协同需求。为了解决多实体协同规避问题,本文引用多智能体系统思想对其进行规避任务决策技术研究。多智能体系统有着自主、高效和可扩展的优点,本文将其与强化学习技术相结合,用以设计飞行器决策算法。本文以航天器反拦截、无人机避碰和空间机械臂轨迹规划等典型任务为研究背景,对多智能体自主规避任务决策问题进行研究,结合真实约束条件,实现智能体的实时决策。本文取得主要研究成果如下:在运动分析基础上给出智能体与环境交互的数学模型。针对多智能体系统规避决策问题,建立部分可观马尔科夫决策模型,考虑部分可观的约束条件,结合博弈理论研究了多智能体马尔科夫博弈问题,分析常规回报函数的设计方法,并给出了求解序列决策的三种典型方式。在多智能体强化学习方面,分析了航天器规避机动场景和空间机械臂捕捉场景的决策流程;将策略梯度方法向多智能体系统进行改进研究;提出一种基于策略协调和信度分配的Actor-Critic强化学习方法,用于解决全局可观条件下决策器的训练和策略提升问题,并给出相关收敛性分析;根据任务需求设计各关键环节的神经网络结构和算法流程。分别在航天器反拦截和空间机械臂避障规划等多种任务场景中进行了强化学习训练,通过对累积回报值和成功率的结果对比分析验证了所提方法的正确性和有效性。在强化学习算法应用方面,分析典型任务场景对决策效率的约束情况;针对问题场景设计了进行任务决策的神经网络结构,并对其不同部分设计压缩方法;在神经网络权值聚类和量化的基础上,提出一种自适应分层重构剪枝方法,该方法以重训练的方式对目标神经网络进行动态剪枝和压缩,用于提高决策器运行速度,并压缩其存储空间;对部分可观条件下的任务场景进行强化学习系统设计,详细给出了回报函数的设计方法。分别在有限空域大量无人机场景和多航天器反拦截场景对提出方法进行仿真验证,从决策运行速度、累计回报值和成功率等方面对算法性能进行分析和讨论,并验证了所提强化学习方法对实体数量可变环境的适应性。在任务环境稀疏奖励问题上,对任务场景约束和常规强化学习算法局限性进行分析,设计了案例评价机制;提出逆值法强化学习算法,解决了奖励延迟分配和无奖励引导系统学习效率低的问题;基于马尔科夫博弈理论设计了自学习系统,并结合启发式搜索思想分析了所提算法的收敛性;分析了有扰动状态输入情况,并设计了用于对比分析的有限状态机;分析了算法优势和改进方向。在仿真验证中与前文章节训练所得决策器进行了对比分析,验证了所提算法的正确性和相关性能优势。本文对多智能体决策技术进行探索,研究了信度分配、策略协调、执行提速和稀疏奖励等重要方向,提高了航空航天硬件设备在执行任务中的存活率,所得研究成果对航空航天安全保障技术的发展具有一定的参考价值。
刘晓敏[2](2021)在《非线性双时间尺度系统自学习优化控制》文中进行了进一步梳理非线性双时间尺度(Two-Time-Scale,TTS)系统是一种包含快变、慢变动态的复杂系统,广泛存在于过程工业、航空航天、智能电网等领域。由于系统的高阶特性和快慢动态耦合,在性能分析和控制器设计过程中可能出现高维和病态数值问题。同时,实际系统普遍存在的时滞、扰动、未建模动态等问题,给非线性TTS系统的分析和设计带来重大挑战。已有鲁棒控制、最优控制方法对扰动信息或模型动态信息的依赖程度高,缺乏自学习能力。因此,研究非线性TTS系统的自学习优化控制方法具有重要意义。本文将奇异摄动理论与逆最优控制、滑模控制以及强化学习等方法结合,提出一系列自学习优化控制算法,可有效克服高维和病态数值问题。本文主要研究成果如下:(1)针对一类具有时滞的非线性TTS神经网络,提出稳定性判据和逆最优同步控制方法。首先,针对具有多时变时滞的非线性TTS神经网络,通过构造一个与时间尺度参数ε相关的时滞依赖Lyapunov-Krasovskii泛函,建立系统渐近稳定的充分条件,并且给出稳定界的估计方法。然后,针对具有常时滞的非线性TTS神经网络,通过构造一个依赖时间尺度参数ε的控制Lyapunov函数,并将Hamilton-Jacobi-Bellman(HJB)方程和逆最优技术相结合,提出状态反馈最优同步控制方法,有效避免了病态数值问题。最后,通过数值例子仿真说明所提出的稳定性判据保守性小,所设计的同步控制器能够使两个系统同步速率更快。(2)针对一类具有未知扰动的TTS系统,提出基于自适应滑模控制的扰动抑制方法。首先,引入块对角化方法对全阶系统进行分解,得到解耦的快、慢子系统模型。然后,构造等效输入扰动对未知扰动进行估计。基于降阶子系统模型,利用Lyapunov方程构造组合滑模面。结合等效输入扰动估计,设计自适应滑模控制器,并证明满足可达性条件。设计过程可避免高维和病态数值问题。最后,通过磁带系统仿真验证所提控制方法能够在不知任何先验扰动信息的前提下,自适应地补偿扰动所带来的不利影响。(3)针对一类慢动态未知的非线性TTS系统,提出基于强化学习和T-S模糊方法的组合优化控制方法。首先,运用奇异摄动理论,将原始最优控制问题转化为两个降阶子问题。然后,为解决慢子问题,引入非线性坐标转换处理未知非标准型慢效用函数,提出基于强化学习的慢控制器设计算法。考虑快子系统的慢时变特性,建立T-S模糊快模型,采用并行分布式补偿方法设计快控制器。在考虑多源近似误差的情况下,证明慢控制器设计算法的收敛性、组合控制器的次优性和闭环系统的稳定性。设计过程可有效避免高维和病态数值问题。最后,通过数值例子和电机系统仿真说明在慢动态未知的情况下所设计的组合控制器与最优控制器之间是O(ε)程度近似的,且能够使闭环TTS系统渐近稳定。(4)针对一类动态完全未知的非线性TTS系统,提出基于强化学习的降阶优化控制方法。首先,运用奇异摄动理论,将原系统降阶为一个低阶系统,给出求解相应HJB方程的策略迭代算法,并保证算法的收敛性。然后,运用原系统的慢状态测量重构不可测的降阶系统状态,采用执行-评价神经网络近似降阶控制器和性能指标,在强化学习框架下实现该策略迭代算法,神经网络权值由加权残差法更新。在考虑神经网络近似误差、状态重构误差的情况下,证明迭代算法收敛性、降阶控制器的次优性以及闭环TTS系统的稳定性。设计过程可有效避免高维和病态数值问题。最后,通过数值例子和倒立摆系统仿真说明在动态完全未知的情况下所设计的降阶控制器与最优控制器之间是O(ε)程度近似的,且能够使闭环TTS系统渐近稳定。该论文有图29幅,表8个,参考文献164篇。
王文奎[3](2021)在《基于改进智能算法的滑行灯伺服控制系统仿真研究》文中研究说明自动化和机电智能一体化技术的不断成熟标志着全方位智能化、人性化的工业发展趋势逐渐增强,智能照明技术也在日趋进步,而飞机滑行灯的固定模式无法满足驾驶员在夜间转弯时的安全性和舒适性需求。因此提出一种关于滑行灯的位置随动转向系统,以此为应用背景,通过研究有刷直流伺服电机和无刷直流电机的工作原理和控制方法,分别从理论上设计出了PID控制器、模糊PID控制器、特性观测器补偿控制器、BP神经网络PID控制器和基于模糊系数修正的BP神经网络PID控制器。并依次对两类伺服控制系统进行仿真分析,对比它们的响应速度,控制精度和抗干扰能力等响应特性。在根据实际需求建立灯具转角模型的前提下,首先以直流伺服电机为研究对象,通过分析其工作原理建立动力学模型及其闭环传递函数,再利用Matlab中的Simulink工具库搭建控制系统仿真模型,观测分析伺服电机在阶跃信号和正弦信号输入下的响应特性。然后以无刷直流电机为研究对象,建立其位置-速度-电流三闭环控制系统。采用空间矢量法驱动电机,对比研究位置控制器在运用不同算法下的优缺点。在此框架中,基于对滑行灯随动转向角位置精度、响应速度、抗干扰能力和动、静态稳定性等多个维度的考量,分析导致系统不良输出的主要影响因素并建立基于摩擦模型及负载模型指数收敛观测器补偿的模糊PID控制,经过仿真对比凸显出几种常规算法及其改进策略所存在的不足。继而结合BP神经网络和模糊理论建立新的PID复合控制算法。针对BP神经网络也存在收敛速度慢、训练样本获取困难且容易陷入局部极值等问题,依据补偿控制理论在神经网络前向网络和反向调节之间的节点位置引入修正系数,并利用模糊控制器对其作进一步在线调整,经仿真验证:改进后的智能控制算法具有较强的抗干扰能力和信号跟踪能力,且响应速度不低于常规控制策略。最后,根据系统结构完成软件设计并搭建以STM32F405微处理器和无刷直流电机为核心的硬件试验平台,通过对内环控制器参数的整定得出:转矩电流分量相比于磁通电流分量的控制器参数对系统的瞬态和稳态特性具有十分显着的调节作用,从而印证了前文以转矩干扰为主要因素检验系统性能的合理性,进而证明此改进智能控制算法在此低速位置控制系统中的可行性和优越性。
许振兴[4](2020)在《基于深度强化学习的自适应光学波前控制研究》文中研究说明自适应光学(Adaptive Optics,AO)技术通过改变波前校正器相位来补偿入射畸变波前,从而改善光学系统的性能,被广泛应用于天文观测、激光通信系统、视网膜成像、激光光束净化等光学系统。AO系统作为有效的主动补偿技术,虽然在各领域取得了很好的校正效果,但传统闭环控制方法将AO控制系统视为线性时不变系统,这使得传统控制方法无法处理各类误差带来的不确定性,无法发挥系统潜力获得最优性能。本文从传统AO控制方法与深度强化学习找到结合点并做探索性研究,建立自学习智能控制模型。深度学习与强化学习的结合将感知环境和系统控制无缝连接,使AO能够自动感知不确定的环境状态并完成自适应控制。该AO智能控制模型具有通用性,不依赖于建立准确模型,只需与环境互动学习,利用从外界反馈的回报信号和采集的环境状态不断调整控制策略,使其在线自学习最优控制策略或次优控制策略,可根据系统状态保持或逼近最佳性能。具体来说,传统基于离线建模的线性时不变控制方法无法处理以下三种情形:(1)AO控制平台在长时间运行过程中,受机械平台振动等时变因素的影响,波前校正器与波前传感器的相对位置发生偏移导致对准误差,使得系统参数发生异变无法自适应对准误差。(2)哈特曼传感器缺光引起的斜率信息缺失或噪声引起的斜率测量误差。这类误差直接耦合控制模型,斜率测量误差的传递造成控制性能下降或不稳定。(3)AO系统中时滞普遍存在,时滞校正误差对系统的性能影响很大,因此具有静态控制策略的控制方法无法实现自适应预测控制。本文围绕上述三种情形,展开理论分析和实验研究,建立线性和非线性两种针对AO的智能控制模型。该模型根据当前AO的环境特性进行在线策略优化,始终满足性能约束指标,为解决传统控制手段难以处理误差带来的控制性能下降,以及难以建立准确的系统模型和湍流模型提供了新思路。本文的主要研究内容如下:1.基于哈特曼传感器的AO系统其误差传递过程不可避免,误差传递将影响系统的校正性能,最大程度的补偿或抑制误差传递可显着提高系统的校正性能。AO主要误差来源分为五类:(1)H-S透镜阵列对波前的有限分割采样带来的空间采样误差;(2)斜率测量过程中噪声因素引入的斜率测量误差;(3)强闪烁条件下H-S子孔径斜率探测不理想或信息缺失;(4)H-S与变形镜的空间失配导致对准误差;(5)系统时滞因素导致的时滞校正误差。通过对上述五类误差进行分析,将其转化为组合目标函数的优化问题,推导出了利用组合目标函数的梯度信息作为误差补偿手段,为后续基于梯度信息的在线学习模型提供了理论基础。2.提出了AO系统的线性学习模型,该模型将远场性能指标和估计误差平方和的线性组合作为目标函数,能够自适应系统参数变化,不依赖于建立准确的系统模型。为使得学习模型保持良好的跟踪特性,引入了梯度动量项,动量项累积了之前迭代时的梯度信息,逐步弱化了历史梯度信息对当前模型训练的影响,提高了当前梯度信息的影响,动量项的引入避免了在线样本存储。同时还给出了模型的并行异步优化方法以及模型参数的初始化策略。最后,搭建了AO实验平台来验证线性学习模型的性能,实验结果表明该模型兼顾了斜率信息缺失补偿和自适应抑噪能力,显着提高了系统控制精度。数值分析表明,在不需要重新测量响应矩阵的情况下,实现了对准误差下的自适应性。该模型简单高效,具有一定的工程意义,但由于线性模型学习能力有限,当存在多对一映射关系时其学习过程容易产生线性偏移。3.针对线性学习模型存在的学习能力有限问题以及对湍流扰动的预测控制问题进行建模。提出了基于深度强化学习理论的非线性动态学习模型,该模型采用神经网络的泛映射性拟合策略函数,并通过强化学习的确定性策略梯度方法实现在线滚动优化策略。但是在实际在线策略优化时,若模型目标函数的梯度矩阵测量不准确或突增,则可能导致梯度爆炸使得学习模型不能正常工作。为避免梯度爆炸,保证网络模型稳定收敛,在该梯度反向传入网络模型之前,将梯度矩阵投影至较小的尺寸上,进行裁剪和约束。同时为了避免学习速率衰减过快,能够对每个网络参数自适应不同的学习速率,采用三点解决方案:一是使用历史窗口;二是对参数梯度动量项的历史窗口序列(不包括当前)使用均值;三是最终梯度项为历史窗口序列均值与当前梯度动量项的加权平均。最后,通过搭建AO实验系统来验证非线性动态学习模型对静态像差以及动态像差的校正能力,实验中引入了HT200热风式大气湍流模拟器来产生不同强度的大气湍流。实验结果表明,非线性动态学习模型具有建模方便以及过程描述可在线获得的特点,能及时弥补由于模型失配、畸变、干扰等因素引起的不确定性,模型通过在线误差补偿和噪声抑制提高了系统的控制精度,其自适应性提高了系统的稳定性。由于模型可在线学习湍流统计特性,无需离线建立湍流模型,实现了自适应预测控制模型,具有明显的工程和理论意义。
刘成鸿[5](2020)在《基于GPS/INS组合的自动投喂船定位及其航向控制研究》文中进行了进一步梳理随着经济的迅速发展,人民生活水平的不断提高,对鱼、虾等水产品的需求量不断增加,但目前水产养殖行业中存在投饵效率不高、投饵密度不均匀、投饵方式不科学等突出问题,进而导致水产品产量低下,市场供不应求。因此,致力于研究高效、均匀的智能化投喂装备是目前水产养殖领域的热点研究问题。基于此,本文提出了一种自动投喂船沿规划路径对养殖水域进行均匀投喂的方法,该投饵方法对提高养殖户水产品产量有着十分重大的意义。本文的研究围绕着大面积养殖水域下自动投喂船在水中的定位和航向控制问题展开,提出了全球定位系统(GPS)/惯导系统(INS)组合对自动投喂船精准定位、神经网络的模糊PID对其航向控制的方案。本文主要研究工作有:第一,分析了在具有风、浪等外界复杂环境因素下,自动投喂船采用单一的定位传感器GPS或INS定位精度不高的原因,定义了自动投喂船的相关坐标系和它们之间的关系,推导了自动投喂船惯性导航捷联解算,建立了自动投喂船惯导误差模型。第二,为了弥补自动投喂船在水中单一定位传感器定位精度的不足,提出了GPS/INS组合的定位方案。分析了组合定位的模式,确立了自动投喂船系统的状态变量,构建了自动投喂船系统动态特性的状态方程和量程方程,研究了以卡尔曼滤波为基础的组合导航定位数据融合算法,设计了自动投喂船组合定位系统的仿真实验,结果表明相对于单一定位传感器GPS或INS,GPS/INS组合定位系统具有较高的定位精度和鲁棒性。第三,基于GPS/INS组合定位得出自动投喂船的位置信息,与规划路径还是存在一定的偏离值,要对其进行纠偏,本文提出了一种基于神经网络的模糊PID航向控制算法,通过实验对比分析,本文提出的航向控制算法具有更佳的控制性能,系统的响应时间更短,超调量更小,稳定性更强。第四,完成了自动投喂船的系统搭建,设计了定位精度和饵料投喂实验,通过定位精度实验和投饵实验,证明了本文所提出的GPS/INS组合定位具有较高定位精度,在复杂多变的水中具有更好的自主在线航向调整能力,投饵效率更加高效,饵料密度分布的各项参数均优于传统投饵方式,对智能水产养殖行业具有很大的实用价值。
于皓宇[6](2020)在《基于T-S模型的电子节气门控制算法研究》文中研究说明随着我国经济的飞速发展,汽车保有量逐年递增,人们不仅追求汽车的动力性和稳定性,还对经济性、安全性、油耗和排放等提出了更高的要求。节气门作为控制发动机进气量的一道阀门,是控制发动机工作时达到最佳空燃比的一个重要部件。相较于传统机械式节气门,电子节气门可以实现不同工况下更精确的开度控制,从而控制进气量配合发动机喷油系统达到最佳空燃比,进一步提升汽车的动力性和稳定性,降低油耗和减少污染物的排放。通过对电子节气门控制系统的非线性特性和实际扰动进行分析,建立动态数学模型,研究基于T-S模型的模糊控制算法,提高电子节气门闭环控制系统性能。本文首先分析了电子节气门控制系统的基本结构和工作原理,重点研究了电子节气门系统因机械结构所产生的非线性特性,其中包括非线性复位弹簧、非线性摩擦、齿轮间隙以及进气气流对电子节气门阀片冲击所带来的非线性扰动。并根据动力学分析建立了电子节气门控制系统的数学模型和仿真模型,通过实验和查阅文献得到模型物理参数。针对电子节气门非线性特性及实际工况下所产生的扰动和参数摄动问题,提出了一种基于T-S模型的模糊PID控制策略,根据电子节气门PID控制策略的成功控制经验,结合T-S模型模糊控制理论,最终确定隶属度函数和模糊规则完成控制器的设计。仿真结果表明,与常规PID控制策略相比T-S型模糊控制策略可以有效的克服电子节气门控制系统的非线性特性,并在系统受外界干扰和参数摄动的影响下依旧保持良好的稳态和动态性能,具有无超调、无震荡、控制精度高、鲁棒性强等优势。为解决人工选取模糊规则和隶属度函数的偏差,提出基于自适应神经网络的模糊控制参数优化算法,利用神经网络的自学习能力,优化模糊控制器中的模糊规则、隶属度函数分布和输出函数,进一步提高控制器的性能,提高控制精度。从神经网络训练结果可以看出,该算法有效的优化了T-S型模糊PID的模糊规则,调整了隶属度函数分布。仿真结果表明,优化后的控制策略相较于T-S型模糊PID控制策略,调节时间更快,稳态误差更小。
刘欣[7](2020)在《手持稳定云台伺服系统自抗扰控制研究》文中进行了进一步梳理手持稳定云台是一种保持相机视轴稳定的摄影辅助器材,伺服系统控制是云台的基础。云台伺服系统存在许多不确定因素,在受到外界气流、机身抖动、摩擦力矩、负载变化等内外部扰动的影响时,系统就具有时变性、非线性,这些不确定因素均会制约云台的性能,因此,设计优良的控制系统显得尤为重要。目前大部分云台控制系统是基于经典的PID控制,但在复杂工作环境下PID控制存在超调大和抗扰能力差等缺陷。为此,本文主要研究了几种估计补偿不确定因素的主动抗扰控制算法,完成的主要研究工作如下:1.若自抗扰控制的扩张状态观测器未能对扰动实现准确估计,存在经扰动补偿后的系统与“串联积分标准型”系统会有较大差距的问题,常规非线性状态误差反馈控制性能变差,为此,本文提出了一种基于附加惯性项RBF神经网络的云台自抗扰控制方法。使用单神经元和附加惯性项RBF神经网络对自抗控制中的非线性状态误差反馈控制律进行改进,利用神经网络的自学习能力提升自抗扰控制的自适应能力,实现了对云台伺服系统的性能稳定控制。2.针对自抗扰控制参数调整过程耗时且费力的问题,本文提出了一种基于BP神经网络的云台自抗扰控制方法。设计使用单个BP神经网络同时在线自动调整自抗扰控制中的5个关键参数,提出使用基于采样步长的方法选择神经网络输出层的增益系数,实现了同时对自抗扰控制器中的扩张状态观测器和非线性状态误差反馈的关键参数进行自整定寻优,并成功应用于云台伺服系统控制中。3.为了克服不确定因素对云台伺服系统的影响,本文提出了一种基于跟踪-微分器与RBF神经网络逼近扰动的云台滑模控制方法。首先将系统不确定项视为总扰动,设计了一种滑模控制器,随后基于Lyapunov稳定性分析理论设计RBF神经网络对总扰动进行逼近,并设计了一种前馈加扰动补偿的滑模控制律,通过改进限时间收敛三阶跟踪-微分器来解决控制律中前馈信号的提取问题,实现云台伺服系统的控制。仿真结果表明:以上几种控制方法实现了云台伺服系统稳定精确控制,与传统PID控制、常规自抗扰控制、滑模控制等控制方法相比,以上改进算法均具有更好地自适应能力,能更好的应对不确定因素造成的影响。具有快速性良好,控制精度高,鲁棒性和抗扰性强等优点。因此,本文研究的几种控制算法具有较好的理论参考价值和实际应用价值。
孙润稼[8](2020)在《大停电后机组恢复在线智能决策优化研究》文中进行了进一步梳理随着社会经济的发展,电力需求持续增长,风电等多种可再生能源大规模接入电网,电力系统迅速发展,国家、社会和人民对于电力的依赖性越来越高。大面积停电事故会威胁人民的生命财产乃至国家社会的安全,在发生大停电后快速实现电网自愈有利于减轻这种负面影响。电网自愈恢复的首要任务是完成发电机的启动并建立骨干网架,尤其在电力系统恢复前期,机组恢复更是重中之重。因此,全方位研究考虑骨干网架重构的机组恢复问题,对于安全、有序和快速的电网自愈具有十分重要的理论意义和实用价值。合理有效的机组恢复方案能够充分考虑恢复过程中的多种影响因素,大停电发生后有效指导调度人员,完成机组恢复的同时,构建骨干网架。充分利用快速发展的电力信息系统,在线智能逐步进行机组恢复决策,能有效应对恢复方案与实际恢复过程不相符的情况。对于停电风险更大的高比例风电系统,在线指导大规模风电场与传统机组的恢复,能够利用风速条件较好的风电场促进恢复进程。本文在已有研究成果的基础上,对考虑骨干网架重构的机组恢复在线智能决策优化进行了深入的分析研究,利用偏好多目标优化、进化计算、深度学习、强化学习以及蒙特卡洛树搜索等人工智能技术,构建了从恢复方案制定到在线恢复决策再到考虑风功率参与的机组恢复的全方面机组恢复智能决策优化体系。论文的主要研究工作和取得的创新性成果如下:(1)整合机组恢复相关的多方面影响因素,提出一种基于偏好多目标优化的机组恢复方法,用于优化制定机组恢复方案。一方面,分别从机组、网架以及负荷三个电力系统基本要素出发,提出系统总发电能力、线路平均重要度以及骨干网架内重要负荷百分比作为机组恢复评价指标。综合考虑多个优化目标和约束,并依据对于不同目标的偏好性,建立偏好多目标优化模型。另一方面,针对所建优化模型偏好性和离散性的特点,提出一种基于偏好的离散非支配排序遗传算法(Preference-based Discrete Nondominated Sorting Genetic Algorithm Ⅱ,PD-NSGA-Ⅱ)。分别提出基于偏好的支配关系和松弛的Pareto支配关系,作用于外部种群和正常种群,提高了算法对于机组恢复问题的求解效率。算例结果表明采用所提偏好多目标优化模型所得方案在强调机组恢复的同时,考虑了所建骨干网架对于后续恢复的影响和经济性因素。PD-NSGA-Ⅱ相较同类型算法对机组恢复问题具有更高的求解效率,能够获得数量可控且高质量的解。最终所得解的数目可由决策者提前设置,方便对最终方案进行决策,该方法对于机组恢复方案的优化制定具有较高的实用价值。(2)为应对停电后系统的初始状态和机组恢复过程的不确定性,提出一种基于蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)和稀疏自动编码器(Sparse Autoencoder,SAE)的机组恢在线恢复动态决策方法。建立包含离线准备工作和在线决策的机组在线恢复框架,通过逐步决策将要恢复的输电线路,完成机组恢复,并形成骨干网架。提出机组恢复效率评价指标,用于指引决策过程。采用SAE离线学习机组恢复相关数据,建立估值网络用于MCTS算法,快速评估某一系统恢复状态下最优机组恢复效率指标。引入MCTS进行机组恢复在线决策,并提出改进的上限置信区间算法、剪枝技术以及基于估值网络的模拟技术,有效提高了对于下一步将要恢复线路的搜索效率,进一步采用并行计算,保证机组恢复决策的在线实现。算例结果表明SAE是一种理想的机组恢复数据学习训练算法。基于改进的上限置信区间算法、剪枝技术以及估值网络的MCTS算法搜索效率明显提高,可靠地保证了机组恢复决策的在线实现。所提方法能够自动应对恢复过程中可能存在的线路恢复时间与预设值不符或者线路恢复失败等不确定情况,并且所得方案比离线方法所得方案具有更高的鲁棒性。(3)提出一种基于实时系统状况和风功率预测信息的考虑风电场参与的机组恢复在线决策方法,逐步决策将要恢复的输电线路,在线辅助调度员完成风电场与常规机组的恢复。同时考虑系统最大发电能力与火电机组热启动,提出机组恢复评价指标用于评价考虑风电场机组恢复的表现。由于风功率场景的多样性,提出一种基于强化学习的自学习策略学习机组恢复数据,生成策略网络。所得策略网络可根据系统状态快速估算各条备选线路被投入的概率,将其应用到MCTS,能够提升算法的搜索效率。为保证恢复期间系统的有功平衡,采用模型预测控制进行风功率控制,提出滚动优化模型,基于实时状态和预测信息优化已恢复风电场的有功出力。算例结果表明所提自学习策略能够在可调整的时间内获得有效的策略网络,其所得策略网络能够提升恢复决策的效率。所提方法能够针对不同的风功率场景做出合理决策,并自发应对恢复过程中突然发生的风电爬坡事件。所提风功率控制方法能够有效保证机组恢复期间的有功平衡,并通过牺牲一定有功出力为可能发生的风电爬坡事件提供控制冗余。
崔国栋[9](2020)在《基于神经网络的磁悬浮控制研究》文中进行了进一步梳理在大中型风电机组中,水平轴风力发电机占据主导地位,偏航系统是其重要组成部分。传统偏航系统基于齿轮驱动技术,存在结构复杂、故障率高、占用空间大等弊端,而基于磁悬浮技术的一种新型风电磁悬浮偏航系统具有无摩擦、结构简单、无需润滑、安装维修方便、停电时间短等优势。但因存在侧风作用的不确定性和磁悬浮系统本身的非线性,这种风电磁悬浮偏航系统的悬浮控制面临巨大挑战。人工神经网络具有自适应、自学习、非线性适应性信息处理能力,为此,本文基于神经网络控制理论对新型磁悬浮偏航系统的悬浮控制开展研究。本文主要研究工作如下:1、基于力学分析和电磁学理论,建立了风电磁悬浮偏航系统悬浮过程的动态数学模型。为了方便后续控制器的设计,本文研究了系统模型的开环稳定性和能观能控性。2、本文根据传统BP神经网络PID控制器的工作原理,针对其存在的BP网络参数调节范围太小的局限性,提出了一种含有量化因子的新型BP神经网络结构,并基于BP神经网络的新结构进行BP-PID控制器的设计。为验证新结构的有效性,我们将所设计的BP-PID控制器用于磁悬浮偏航系统干扰情况下的悬浮控制,并与常规级联PID控制器进行对比。仿真结果表明,基于新结构的BP-PID控制器不仅能够有效调节PID控制器的参数,而且与常规级联PID控制器相比,它的动态性能更好,鲁棒性更强。3、对新的BP-PID控制器而言,其存在鲁棒性相对较弱,电流跟踪性能相对较差的弊端。为此,本文将径向基神经网络(RBF神经网络)与滑模控制(SMC)相结合进行气隙外环的控制器设计,并对电流内环提出了自适应控制器。此外,为进一步解决滑模控制中存在的抖振问题,本文提出了一种基于双曲正切函数的新型指数趋近律。为验证所提控制器的有效性,我们将其与BP-PID控制器分别应用于磁悬浮偏航系统干扰情况下的悬浮控制。仿真结果表明,新设计的控制器在鲁棒性和电流跟踪性能方面均优于BP-PID控制器。
侯睿[10](2020)在《水轮机模型参数辨识及其调节系统控制优化》文中提出水轮发电机组是一个非线性、时变、涉及水机电耦合的非最小相位复杂的系统,难以采用精确的数学模型描述。运用系统辨识理论和方法,对水轮机模型进行辨识是研究热点之一。本文在前人研究的基础上,经过一些推导建立得到相对具有清晰物理涵义且完整的水轮机调节系统模型,运用智能辨识算法对水轮机模型参数辨识问题进行了研究。其次基于神经网络结合模糊控制理论对辨识改进的水轮机模型及水轮机调节系统进行优化控制参数的相关研究。仿真结果表明,参数辨识得到的水轮机模型具有具有与实际(样本对)数据较高的拟合度。基于智能优化算法的PID控制和模糊神经网络控制可以在一定程度上很好地改善水力发电机组在负荷和频率扰动下的过渡过程,具备良好的控制品质。本文主要的研究内容由下组成:(1)按照引水系统、水轮机、发电机和调速器四个主要组成部分分别对子系统进行推导建模。(2)参考IEEE Working Group针对不同情况给出的水轮机模型和改进模型,选取并建立了符合实际输入输出响应的并且是可辨识的数学模型,运用最小二乘辨识算法和最优控制理论直接辨识待辨识对象的物理参数。考虑导水机构水力损失的非线性水轮机模型,运用遗传算法进行参数辨识得到符合实际(样本对)的模型参数。(3)用MATLAB中Simulink模块构建全机组仿真运行的模拟平台。考虑随动系统引入非线性环节的水轮机调节系统,对其进行了多扰动下的仿真研究。(4)选取已辨识的精确水轮机模型,导进全机组模拟仿真平台,构成完整的调节系统模型,运用模糊控制理论进行PID控制参数优化,并形成模糊PID控制器封装模块,与原来的控制参数的PID调节系统模型进行比较证明其控制性能更好。在此基础上,形成模糊神经网络控制器,比模糊自适应PID有更好的控制品质。
二、基于神经网络的自学习模糊控制(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于神经网络的自学习模糊控制(论文提纲范文)
(1)多智能体系统自主规避任务决策方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题背景与研究意义 |
1.2 典型多智能体系统技术发展 |
1.2.1 无人机集群避碰技术研究现状 |
1.2.2 多自由度空间机械臂避障技术研究现状 |
1.2.3 航天器规避机动算法发展现状 |
1.3 基于自学习理论的决策方法国内外研究现状 |
1.3.1 多智能体深度强化学习方法研究现状 |
1.3.2 深度神经网络压缩及加速方法研究现状 |
1.3.3 稀疏奖励强化学习方法研究现状 |
1.4 主要研究内容及论文结构 |
1.4.1 存在问题及技术难点 |
1.4.2 研究内容及章节安排 |
第2章 多智能体系统决策模型 |
2.1 引言 |
2.2 动力学相关描述 |
2.2.1 多智能体系统运动模型 |
2.2.2 空间拦截器制导律 |
2.3 多智能体部分可观决策模型 |
2.3.1 马尔科夫决策过程理论基础 |
2.3.2 分布式部分可观马尔科夫博弈 |
2.3.3 常规回报函数设计思路 |
2.4 序列决策问题求解方法 |
2.4.1 模糊系统 |
2.4.2 有限状态机 |
2.4.3 蒙特卡洛树搜索 |
2.5 本章小结 |
第3章 基于ACTOR-CRITIC架构的自主决策算法 |
3.1 引言 |
3.2 问题场景描述 |
3.2.1 航天器规避机动问题场景描述 |
3.2.2 空间机械臂轨迹规划场景描述 |
3.2.3 多智能体系统决策流程分析 |
3.3 多智能体策略梯度强化学习方法 |
3.3.1 算法基础理论框架 |
3.3.2 策略梯度算法收敛性分析 |
3.3.3 策略梯度方法在多智能体系统中应用 |
3.4 基于信度分配的多智能体强化学习框架 |
3.4.1 航天器规避决策方法 |
3.4.2 案例优选的空间机械臂决策方法 |
3.4.3 基于信度分配的算法收敛性分析和改进 |
3.4.4 网络结构设计及算法流程 |
3.5 仿真及结果分析 |
3.5.1 基于最优控制理论的对比算法 |
3.5.2 航天器规避机动仿真 |
3.5.3 空间机械臂轨迹规划仿真 |
3.5.4 强化学习算法仿真结果简析 |
3.6 本章小结 |
第4章 多智能体分布式协同避碰决策方法研究 |
4.1 引言 |
4.2 有限空域无人机集群避碰问题分析 |
4.2.1 求解策略的训练方法 |
4.2.2 在线协调和沟通机制 |
4.3 多智能体强化学习系统设计 |
4.3.1 状态空间和动作空间选取 |
4.3.2 系统体系结构和流程分析 |
4.3.3 回报函数设计 |
4.4 仿真及结果分析 |
4.4.1 仿真条件设定 |
4.4.2 训练曲线及场景案例仿真 |
4.4.3 结果分析 |
4.5 本章小结 |
第5章 基于优化神经网络的分布式规避决策方法 |
5.1 引言 |
5.2 多航天器对多拦截器协同规避问题研究 |
5.2.1 状态空间和动作空间选取 |
5.2.2 系统体系结构和流程分析 |
5.2.3 回报函数设计 |
5.3 基于自适应重构方法的深度神经网络优化方法 |
5.3.1 神经网络结构设计 |
5.3.2 权值聚类及量化 |
5.3.3 自适应分层重构剪枝 |
5.4 仿真及结果分析 |
5.4.1 基于微分对策理论的对比算法 |
5.4.2 神经网络优化算法试验及数值仿真 |
5.4.3 强化学习训练及场景案例仿真 |
5.4.4 结果分析 |
5.5 本章小结 |
第6章 基于逆值法的多航天器自学习规避算法 |
6.1 引言 |
6.2 稀疏奖励强化学习算法分析 |
6.2.1 规避任务分析 |
6.2.2 常规强化学习方法局限 |
6.2.3 逆值法强化学习算法 |
6.2.4 算法核心逻辑流程 |
6.3 多智能体稀疏奖励自学习系统设计 |
6.3.1 自学习系统结构设计 |
6.3.2 信念状态估计方法 |
6.3.3 逆值法在案例中的收敛性简析 |
6.3.4 网络结构和算法流程 |
6.4 仿真及结果分析 |
6.4.1 基于有限状态机的对比算法 |
6.4.2 仿真条件设定 |
6.4.3 结果对比分析 |
6.4.4 算法优势及改进分析 |
6.5 本章小结 |
结论 |
参考文献 |
攻读博士学位期间发表的论文及其它成果 |
致谢 |
个人简历 |
(2)非线性双时间尺度系统自学习优化控制(论文提纲范文)
致谢 |
摘要 |
abstract |
变量注释表 |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状及问题分析 |
1.3 论文主要工作及章节安排 |
2 时滞非线性双时间尺度神经网络稳定性分析与逆最优同步控制 |
2.1 引言 |
2.2 具有时变时滞的双时间尺度神经网络稳定性分析 |
2.3 具有常时滞的双时间尺度神经网络逆最优同步控制 |
2.4 本章小结 |
3 具有未知扰动的双时间尺度系统自适应滑模控制 |
3.1 引言 |
3.2 问题描述和预备知识 |
3.3 基于等效输入扰动的自适应滑模控制器设计与性能分析 |
3.4 仿真研究 |
3.5 本章小结 |
4 慢动态未知的非线性双时间尺度系统强化学习组合优化控制 |
4.1 引言 |
4.2 问题描述和预备知识 |
4.3 基于RL和T-S模糊的组合次优控制器设计与性能分析 |
4.4 仿真研究 |
4.5 本章小结 |
5 动态完全未知的非线性双时间尺度系统强化学习降阶优化控制 |
5.1 引言 |
5.2 问题描述和预备知识 |
5.3 基于RL的次优降阶控制器设计及性能分析 |
5.4 仿真研究 |
5.5 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简历 |
学位论文数据集 |
(3)基于改进智能算法的滑行灯伺服控制系统仿真研究(论文提纲范文)
摘要 |
Abstract |
注释表 |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 自适应照明技术发展现状 |
1.2.2 智能控制概述 |
1.2.3 无刷直流电机的控制研究现状 |
1.3 主要研究内容及创新点 |
1.3.1 主要内容 |
1.3.2 论文创新点 |
1.4 本章小结 |
第2章 系统建模及伺服电机控制原理 |
2.1 建立转角模型 |
2.2 建立执行机构动力学模型 |
2.3 建立电机数学模型 |
2.3.1 直流伺服电机数学模型 |
2.3.2 无刷直流电机的基本结构和数学模型 |
2.4 无刷直流电机的工作原理 |
2.5 无刷直流电机的运动特性 |
2.5.1 启动特性 |
2.5.2 工作特性 |
2.5.3 调速特性 |
2.6 本章小结 |
第3章 观测器补偿FPID伺服电机控制仿真 |
3.1 模糊PID控制器 |
3.1.1 PID控制算法 |
3.1.2 模糊自整定原理 |
3.2 模糊PID控制器设计 |
3.2.1 选择变量及模糊化 |
3.2.2 建立模糊规则 |
3.2.3 Simulink仿真 |
3.3 基于摩擦模型观测器补偿FPID控制 |
3.3.1 建立摩擦模型 |
3.3.2 系统仿真 |
3.4 基于负载模型的指数收敛观测器补偿FPID控制 |
3.4.1 建立基于负载模型的指数收敛观测器 |
3.4.2 系统仿真 |
3.5 本章小结 |
第4章 模糊系数修正BP-PID伺服电机控制仿真 |
4.1 BP神经网络PID控制 |
4.1.1 BP神经网络 |
4.1.2 BP神经网络PID控制器的设计 |
4.2 模糊控制调节 |
4.3 扰动补偿理论 |
4.4 控制算法流程: |
4.5 Simulink仿真分析 |
4.5.1 初始化 |
4.5.2 参数优化 |
4.5.3 阶跃响应 |
4.5.4 正弦响应 |
4.6 本章小结 |
第5章 无刷直流电机控制仿真 |
5.1 控制方案的选择 |
5.1.1 无刷直流电机的矢量控制 |
5.1.2 坐标变换 |
5.1.3 SVPWM技术 |
5.2 无刷直流电机控制系统仿真模型的构建 |
5.2.1 电机本体模块 |
5.2.2 逆变器模块 |
5.2.3 坐标变换模块 |
5.2.4 SVPWM调制模块 |
5.2.5 控制器模块 |
5.3 仿真结果分析 |
5.3.1 负载干扰 |
5.3.2 励磁电流干扰 |
5.3.3 位置随动综合分析 |
5.4 本章小结 |
第6章 内环参数整定试验与分析 |
6.1 实验平台简介 |
6.1.1 硬件部分 |
6.1.2 软件部分 |
6.2 试验分析 |
6.2.1 新建MDK工程 |
6.2.2 下载程序 |
6.2.3 参数调节 |
6.3 本章小结 |
总结与展望 |
1 全文总结 |
2 工作展望 |
参考文献 |
致谢 |
附录A 指数收敛观测器(S函数部分程序) |
附录B BP神经网络PID控制(S函数部分程序) |
附录C 攻读硕士学位期间发表的论文 |
(4)基于深度强化学习的自适应光学波前控制研究(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究工作的背景与意义 |
1.2 波前控制技术国内外研究历史与现状 |
1.2.1 有波前探测控制技术 |
1.2.2 无波前探测控制技术 |
1.3 论文结构安排 |
第二章 传统线性控制模型的误差传递 |
2.1 像差表述 |
2.2 哈特曼斜率计算 |
2.3 波前复原 |
2.3.1 区域法 |
2.3.2 模式法 |
2.3.3 直接斜率法 |
2.4 传统线性控制模型 |
2.5 控制模型的误差传递 |
2.5.1 斜率测量误差 |
2.5.2 斜率信息缺失 |
2.5.3 空间采样误差 |
2.5.4 波前测量误差的敏感度分析 |
2.6 H-S与波前校正器的对准误差 |
2.7 本章小结 |
第三章 远场指标梯度抑制误差传递 |
3.1 远场指标梯度估计 |
3.2 梯度信息补偿误差传递分析 |
3.3 梯度信息补偿对准误差分析 |
3.4 本章小结 |
第四章 在线自学习线性控制模型 |
4.1 线性动态学习模型 |
4.2 模型的训练方法 |
4.3 递归最小二乘参数估计 |
4.4 学习模型流程及优化 |
4.5 模型参数初始化策略 |
4.6 实验与分析 |
4.6.1 测量噪声抑制 |
4.6.2 斜率信息缺失补偿 |
4.6.3 自适应对准误差及其数值分析 |
4.7 模型的线性偏移 |
4.8 本章小结 |
第五章 深度强化学习控制模型 |
5.1 非线性动态学习模型 |
5.2 神经网络基本原理 |
5.2.1 前馈计算 |
5.2.2 误差反向传播 |
5.3 模型的训练方法 |
5.4 梯度约束及其优化 |
5.5 强化学习理论框架 |
5.5.1 马尔科夫决策过程 |
5.5.2 值函数与最优性原理 |
5.5.3 TD方法与值函数逼近 |
5.5.4 策略梯度 |
5.6 策略优化流程 |
5.7 实验与分析 |
5.7.1 测量噪声抑制 |
5.7.2 斜率信息缺失补偿 |
5.7.3 动态波前预测控制 |
5.7.4 自适应对准误差及其数值分析 |
5.8 抑制线性偏移 |
5.9 本章小结 |
第六章 全文总结与展望 |
6.1 全文总结 |
6.2 论文主要创新点 |
6.3 后续工作展望 |
致谢 |
参考文献 |
攻读博士学位期间取得的成果 |
(5)基于GPS/INS组合的自动投喂船定位及其航向控制研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 课题研究背景 |
1.2 国内外研究现状 |
1.2.1 自动投喂船定位技术的发展现状 |
1.2.2 GPS/INS组合导航系统的发展现状 |
1.2.3 PID控制算法的研究现状 |
1.3 课题研究的目的及意义 |
1.4 本文研究的主要内容 |
2 自动投喂船导航定位方法研究 |
2.1 引言 |
2.2 自动投喂船GPS导航定位技术 |
2.3 自动投喂船惯性导航定位技术 |
2.4 自动投喂船惯性导航相关坐标系的建立 |
2.5 自动投喂船惯性导航捷联解算 |
2.6 自动投喂船惯性导航系统误差模型分析 |
2.6.1 速度误差模型 |
2.6.2 位置误差模型 |
2.6.3 姿态误差模型 |
2.7 本章小结 |
3 自动投喂船GPS/INS组合定位数据融合算法研究 |
3.1 引言 |
3.2 自动投喂船GPS/INS的组合模式分析 |
3.3 自动投喂船 GPS/INS 组合定位系统状态选择 |
3.4 自动投喂船惯性导航系统元件的误差估计分析 |
3.5 自动投喂船组合定位系统的数学模型 |
3.5.1 自动投喂船组合定位系统状态方程 |
3.5.2 自动投喂船组合定位系统量测方程 |
3.6 自动投喂船组合定位数据融合算法研究 |
3.6.1 基于卡尔曼滤波的自动投喂船组合定位数据融合算法研究 |
3.6.2 基于扩展卡尔曼滤波的自动投喂船组合定位数据融合算法研究 |
3.6.3 基于无迹卡尔曼滤波的自动投喂船组合定位数据融合算法研究 |
3.7 自动投喂船组合导航算法仿真与结果分析 |
3.8 本章小结 |
4 基于BP神经网络的模糊PID自动投喂船航向控制 |
4.1 引言 |
4.2 自动投喂船PID航向控制研究 |
4.3 自动投喂船模糊PID航向控制研究 |
4.3.1 模糊控制器设计 |
4.3.2 模糊自适应整定PID自动投喂船控制器设计 |
4.4 BP神经网络的模糊PID自动投喂船航向控制研究 |
4.4.1 BP神经网络 |
4.4.2 BP神经网络模糊PID自动投喂船控制器设计 |
4.5 自动投喂船航向控制实验 |
4.6 本章小结 |
5 自动投喂船系统搭建与户外投喂实验研究 |
5.1 引言 |
5.2 自动投喂船实验系统搭建 |
5.3 自动投喂船投喂路径规划设定 |
5.4 自动投喂船定位精度测试实验 |
5.4.1 实验湖面环境 |
5.4.2 基准点定位精度实验结果分析 |
5.5 自动投喂船池塘饵料投喂实验 |
5.6 本章小结 |
6 总结和展望 |
6.1 论文总结 |
6.2 研究工作展望 |
参考文献 |
(6)基于T-S模型的电子节气门控制算法研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究的背景及意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 电子节气门研究的问题与难点 |
1.4 本文的主要研究内容 |
第2章 电子节气门工作原理及数学模型建立 |
2.1 电子节气门的结构及工作原理 |
2.2 电子节气门非线性分析 |
2.2.1 复位弹簧非线性 |
2.2.2 摩擦非线性 |
2.2.3 齿轮间隙的非线性 |
2.2.4 进气气流冲击的非线性 |
2.3 电子节气门的数学建模 |
2.3.1 直流电机数学建模 |
2.3.2 复位弹簧数学建模 |
2.3.3 阀片摩擦力矩数学建模 |
2.3.4 节气门阀片数学建模 |
2.3.5 电子节气门的状态空间模型 |
2.3.6 电子节气门仿真模型 |
2.4 电子节气门系统参数 |
2.5 本章小结 |
第3章 基于T-S模型的模糊PID控制算法研究 |
3.1 T-S模糊模型 |
3.2 基于T-S模型的模糊PID控制器设计 |
3.2.1 模糊控制系统基本原理 |
3.2.2 模糊控制器的输入变量和维数 |
3.2.3 输入变量的模糊化运算 |
3.2.4 隶属度函数的确定 |
3.2.5 模糊规则的确定 |
3.3 T-S型模糊PID算法仿真验证 |
3.3.1 输入信号的选择 |
3.3.2 仿真分析 |
3.4 本章小结 |
第4章 基于自适应神经网络的模糊控制参数优化算法研究 |
4.1 模糊逻辑和神经网络 |
4.2 模糊控制参数优化算法 |
4.2.1 网络结构分析 |
4.2.2 学习算法研究 |
4.2.3 隶属度函数的选择 |
4.3 基于自适应神经网络的模糊控制参数优化算法仿真验证 |
4.3.1 仿真控制系统搭建搭建 |
4.3.2 仿真分析 |
4.4 本章小结 |
第5章 全文总结与展望 |
5.1 总结 |
5.2 展望 |
致谢 |
参考文献 |
作者简介 |
攻读硕士学位期间研究成果 |
(7)手持稳定云台伺服系统自抗扰控制研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究状况 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 云台控制技术研究状况 |
1.3.1 经典PID控制 |
1.3.2 滑模控制 |
1.3.3 神经网络控制 |
1.3.4 自抗扰控制 |
1.4 本文的课题来源、组织结构和创新点 |
1.4.1 本文课题来源 |
1.4.2 本文组织结构 |
1.4.3 本文的创新点 |
第2章 云台数学模型及自抗扰控制概述 |
2.1 引言 |
2.2 云台结构及工作原理 |
2.2.1 三轴云台结构 |
2.2.2 三轴云台工作原理 |
2.3 运动学分析 |
2.3.1 位置姿态描述 |
2.3.2 坐标平移变换 |
2.3.3 坐标旋转变换 |
2.3.4 坐标复合变换 |
2.3.5 三轴云台连杆坐标系 |
2.3.6 三轴云台运动学方程 |
2.4 伺服系统动力学方程 |
2.5 自抗扰控制 |
2.6 本章小节 |
第3章 基于附加惯性项RBF神经网络的云台自抗扰控制 |
3.1 引言 |
3.2 附加惯性项RBF神经网络辨识雅克比信息 |
3.3 单神经元改进非线性状态误差反馈 |
3.4 仿真及结果分析 |
3.5 本章小节 |
第4章 基于BP神经网络的云台自抗扰控制 |
4.1 引言 |
4.2 云台伺服系统动力学方程 |
4.3 BP神经网络优化自抗扰控制 |
4.4 仿真实验及结果分析 |
4.5 本章小结 |
第5章 基于跟踪-微分器与RBF神经网络逼近扰动的云台滑模控制 |
5.1 引言 |
5.2 系统描述 |
5.3 滑模控制律设计及稳定性分析 |
5.3.1 滑模控制律设计 |
5.3.2 稳定性分析 |
5.4 设计RBF神经网络逼近不确定项 |
5.5 跟踪-微分器设计 |
5.6 仿真实验及结果分析 |
5.7 本章小节 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士学位期间参与的课题研究及取得的科研成果 |
致谢 |
(8)大停电后机组恢复在线智能决策优化研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 背景和意义 |
1.2 电力系统恢复问题概述 |
1.2.1 电力系统恢复阶段划分 |
1.2.2 电力系统恢复问题的国内外研究现状 |
1.2.3 人工智能在电力系统恢复中的应用 |
1.3 机组恢复问题研究现状分析 |
1.4 论文的主要研究工作 |
第2章 基于预设数据的机组恢复方案优化制定 |
2.1 引言 |
2.2 偏好多目标优化模型 |
2.2.1 优化目标 |
2.2.2 约束条件 |
2.3 PD-NSGA-Ⅱ算法 |
2.3.1 PD-NSGA-Ⅱ算法简介 |
2.3.2 基于偏好的支配关系 |
2.3.3 松弛的Pareto支配关系 |
2.3.4 PD-NSGA-Ⅱ主循环 |
2.4 基于PD-NSGA-Ⅱ的机组恢复优化 |
2.4.1 基因编码 |
2.4.2 连通性检测 |
2.4.3 参考点选取 |
2.4.4 算法流程和方案决策 |
2.5 算例分析 |
2.5.1 新英格兰10机39节点测试系统 |
2.5.2 山东西部电网 |
2.6 小结 |
第3章 基于实时数据的机组在线恢复动态决策 |
3.1 引言 |
3.2 机组在线恢复框架和评价指标 |
3.2.1 机组在线恢复 |
3.2.2 机组在线恢复框架 |
3.2.3 评价指标 |
3.2.4 约束条件 |
3.3 基于SAE的估值网络 |
3.3.1 训练集生成 |
3.3.2 基于PSO的样本标签计算 |
3.3.3 估值网络训练 |
3.4 基于MCTS的机组恢复在线决策 |
3.4.1 MCTS |
3.4.2 改进的UCT算法 |
3.4.3 剪枝技术 |
3.4.4 基于估值网络的模拟 |
3.4.5 MCTS并行实现 |
3.5 算例分析 |
3.5.1 新英格兰10机39节点测试系统 |
3.5.2 山东西部电网 |
3.6 小结 |
第4章 考虑风电场参与的机组恢复在线决策 |
4.1 引言 |
4.2 考虑风电场的机组恢复框架和评价 |
4.2.1 考虑风电场的机组恢复 |
4.2.2 考虑风电场的机组恢复框架 |
4.2.3 评价指标和约束条件 |
4.3 离线自学习 |
4.3.1 自学习方法 |
4.3.2 风功率场景聚类 |
4.3.3 估值网络和策略网络 |
4.3.4 样本生成 |
4.4 机组恢复在线决策 |
4.5 恢复期间风功率控制 |
4.5.1 模型预测控制 |
4.5.2 风电场控制模式 |
4.5.3 风功率模型预测控制 |
4.6 算例分析 |
4.6.1 调整后的新英格兰10机39节点系统 |
4.6.2 山东东北部电网 |
4.7 小结 |
第5章 结论与展望 |
参考文献 |
致谢 |
攻读博士学位期间的研究成果 |
学位论文评阅及答辩情况表 |
(9)基于神经网络的磁悬浮控制研究(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 课题研究背景与意义 |
1.2 国内外研究现状 |
1.3 本文主要研究内容 |
第2章 神经网络的理论基础 |
2.1 神经网络构成的基本原理 |
2.1.1 人工神经元模型 |
2.1.2 连接权 |
2.1.3 神经网络状态 |
2.1.4 神经网络的输出 |
2.2 神经网络的拓扑结构与学习规则 |
2.2.1 神经网络的拓扑结构 |
2.2.2 典型的神经网络学习规则 |
2.3 常用的前馈型神经网络模型 |
2.3.1 BP神经网络 |
2.3.2 径向基神经网络 |
2.4 本章小结 |
第3章 磁悬浮偏航系统的悬浮建模与分析 |
3.1 磁悬浮偏航系统的结构和工作原理 |
3.1.1 磁悬浮偏航系统的结构 |
3.1.2 磁悬浮偏航系统的工作原理 |
3.2 磁悬浮偏航系统的悬浮建模 |
3.3 磁悬浮系统的性能分析 |
3.3.1 开环稳定性分析 |
3.3.2 能观能控性分析 |
3.4 本章小结 |
第4章 基于BP-PID的磁悬浮偏航系统悬浮控制研究 |
4.1 常规PID控制器 |
4.1.1 常规PID控制原理 |
4.1.2 PID控制器的两种控制算法 |
4.2 神经网络的量化因子 |
4.3 基于BP-PID的悬浮控制器设计 |
4.3.1 悬浮控制器的结构设计 |
4.3.2 悬浮控制器的控制算法设计 |
4.3.3 悬浮控制器的参数选择 |
4.4 数值仿真及性能分析 |
4.5 本章小结 |
第5章 基于RBF-ASMRC的磁悬浮偏航系统悬浮控制研究 |
5.1 滑模变结构控制的基本原理 |
5.2 基于RBF-ASMRC的悬浮气隙控制器设计 |
5.2.1 滑模控制器的初步设计 |
5.2.2 基于RBF神经网络的未知参数逼近器的初步设计 |
5.2.3 神经网络滑模控制器的设计 |
5.2.4 鲁棒补偿器和悬浮气隙控制器的设计 |
5.3 基于李雅普诺夫稳定性定理的悬浮电流控制器设计 |
5.4 悬浮控制器的稳定性分析 |
5.5 数值仿真与性能分析 |
5.5.1 系统未知参数逼近效果的仿真分析 |
5.5.2 悬浮控制效果的仿真分析 |
5.5.3 励磁电流和励磁电压的仿真分析 |
5.6 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
在读期间发表的学术论文及研究成果 |
致谢 |
(10)水轮机模型参数辨识及其调节系统控制优化(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题来源 |
1.2 研究背景及意义 |
1.3 国内外研究现状 |
1.3.1 水轮机模型及其精确化的研究现状 |
1.3.2 水轮机模型参数辨识的研究现状 |
1.3.3 调速器控制参数优化研究现状 |
1.4 本文的主要内容 |
第二章 水轮机调节系统数学模型 |
2.1 引言 |
2.2 引水系统模型 |
2.3 水轮机模型 |
2.3.1 非线性水轮机模型 |
2.3.2 线性水轮机模型 |
2.3.3 考虑水力损失的水轮机模型 |
2.4 发电机模型 |
2.4.1 高阶发电机模型 |
2.4.2 一阶发电机模型 |
2.5 控制系统模型 |
2.6 PID调速器离散算法 |
2.6.1 微分环节 |
2.6.2 比例环节 |
2.6.3 积分环节 |
2.7 PI励磁控制器 |
2.7.1 比例环节 |
2.7.2 微分环节 |
2.8 本章小结 |
第三章 水轮机模型的参数辨识 |
3.1 引言 |
3.2 参数辨识 |
3.3 最小二乘法与最优控制方法 |
3.3.1 最小二乘算法辨识基础 |
3.3.2 最优控制方法在参数辨识中的应用及流程 |
3.4 模型参数辨识的举例验证 |
3.4.1 获取模拟实测输入输出数据 |
3.4.2 批处理最小二乘法参数辨识 |
3.4.3 基于OCD程序和ITAE准则的参数辨识 |
3.5 遗传算法参数辨识 |
3.5.1 遗传算法在辨识中应用的基本原理 |
3.5.2 获取实测输入输出数据 |
3.5.3 辨识过程 |
3.6 本章小结 |
第四章 水轮机及其调节系统的SIMULINK仿真平台搭建与分析 |
4.1 引言 |
4.2 水轮机调节系统线性的传递函数模型 |
4.3 水轮机调节系统考虑非线性环节的SIMULINK模块仿真 |
4.4 本章小结 |
第五章 基于模糊自适应PID控制器的模糊神经网络控制器应用于水轮机组控制 |
5.1 引言 |
5.2 模糊PID控制器原理 |
5.2.1 模糊PID控制器仿真 |
5.3 基于模糊神经网络理论的控制器设计 |
5.4 模糊神经网络控制器的生成与仿真实例 |
5.5 本章小结 |
第六章 结论与展望 |
6.1 总结 |
6.2 展望 |
致谢 |
参考文献 |
附录 |
附录 A 已录用的学术论文(未见刊) |
附录 B 攻读硕士学位期间参加的科研项目、学术会议和其他获奖情况 |
四、基于神经网络的自学习模糊控制(论文参考文献)
- [1]多智能体系统自主规避任务决策方法研究[D]. 赵毓. 哈尔滨工业大学, 2021(02)
- [2]非线性双时间尺度系统自学习优化控制[D]. 刘晓敏. 中国矿业大学, 2021(02)
- [3]基于改进智能算法的滑行灯伺服控制系统仿真研究[D]. 王文奎. 兰州理工大学, 2021
- [4]基于深度强化学习的自适应光学波前控制研究[D]. 许振兴. 电子科技大学, 2020(03)
- [5]基于GPS/INS组合的自动投喂船定位及其航向控制研究[D]. 刘成鸿. 浙江大学, 2020(06)
- [6]基于T-S模型的电子节气门控制算法研究[D]. 于皓宇. 长春大学, 2020(01)
- [7]手持稳定云台伺服系统自抗扰控制研究[D]. 刘欣. 广西师范大学, 2020(01)
- [8]大停电后机组恢复在线智能决策优化研究[D]. 孙润稼. 山东大学, 2020(08)
- [9]基于神经网络的磁悬浮控制研究[D]. 崔国栋. 曲阜师范大学, 2020(01)
- [10]水轮机模型参数辨识及其调节系统控制优化[D]. 侯睿. 昆明理工大学, 2020(05)