一、支持创新概念设计的多Agent系统(论文文献综述)
胡大鹏[1](2021)在《基于强化学习的多智能体协作建模方法研究》文中研究表明本文是以《中国制造2025》背景,以达到实现智能制造的要求为目标,通过融合工业场景和互联网技术,在全球化充满不确定的局面下提高中国制造业的竞争力。当前工业中智能制造面临资源难共享、过程难协调、依赖领域专家等普遍问题,本文基于Agent,多Agent系统和强化学习等相关技术,构建了面向工业的多Agent混合式智能控制模型,并对多Agent系统中的Agent协作能力、作业调度策略等关键问题进行研究,以实现工业生产过程智能控制。本文基于多Agent技术,将工业过程的工艺关键点、关键设备抽象成若干Agent,构建了一个三层结构的混合式多Agent智能模型。该模型基于JADE框架从而实现底层基础功能,此外通过一些接口实现基于状态表示学习的多Agent协作方法的智能模块及基于强化学习的多Agent系统作业调度方法的智能模块,从而满足工业需求。本文针对工业中Agent接触的环境复杂,以及Agent对重要特征感知能力差的问题,基于M3DDPG算法,提出了SRL_M3DDPG算法,在保留M3DDPG算法的强鲁棒性特点的同时提高设备Agent对重要特征的获取,从而使设备Agent的动作达到预期效果。改进的算法利用状态表示学习来帮助捕捉特征,通过深度神经网络来构造观测值和状态值的映射,然后M3DDPG中的Actor和Critic网络从新的神经网络中学习,而不是从最初的观察中学习,从而使Agent动作达到预期并且能够适应高维数据。本文针对多Agent系统中的作业调度问题,提出了一种将TS算法和Q-learning相结合的TS_Qlearning算法,该方法通过禁忌搜索算法的禁忌表存储算法的早期训练经验,来指导算法的早期训练。并且,TS_Qlearning算法优化了Q-learning算法解决调度问题中的策略,在保留了Q-learning算法的探索优势的基础上,在训练早期指导算法的训练,从而提高算法训练的质量,从而更好的优化资源配置。
李庭阁[2](2020)在《基于多Agent的生鲜农产品物流配送路线优化研究》文中提出随着经济飞速发展,人们对生鲜农产品的需求量剧增。但我国生鲜供应市场化时间短,物流相关设施的发展也在起步阶段,不能与其高速增加的市场需求相匹配。同时,生鲜农产品的配送具有时效性、高频次、小批量、需求点分布不均的特点,提升了配送路线的规划难度。所以,需要对原有的集中配送规划方法进行改革和创新。本文将多Agent技术引入生鲜农产品物流配送路线的优化,利用各Agent协作完成复杂的系统操作,可以辅助系统高效、敏捷、实时的运行,解决新时代生鲜农产品物流面对的新问题和新需求。本文主要内容如下:(1)通过分析了物流配送、生鲜农产品物流配送以及基于Agent的配送的国内外研究现状,提出结合多Agent技术解决生鲜农产品物流配送的主题。(2)结合了多Agent系统的特点,对传统生鲜农产品配送系统进行了调整和优化,设计了多Agent系统模型架构,分析了之间交互、协商的具体流程与细节,对各Agent内部结构详细概述,并构建了实际应用多Agent模型的扩展系统的架构。(3)对基于多Agent背景下生鲜农产品配送路线优化的数学模型和优化算法进行了设计,对结果进行分析并提出改进意见。首先构建静态需求下的优化模型,目标函数为配送总成本最低,利用改进的蚁群算法进行求解;其次构建需求变动的模型,目标函数为插入动态需求后造成的额外成本最低,利用插入算法求解。(4)选取京客隆配送中心和旗下门店为实例研究对象进行分析,得到最优的优化方案,为相关物流企业提供一定解决问题的思路。并对方案进行扩展分析,通过调整参数、增加配送需求点等验证模型和算法的适用性。图23幅,表21个,参考文献38篇。
张公鹏[3](2020)在《景区应急管理客流调控仿真与决策支持研究》文中认为近30年来,现代旅游产业蓬勃发展,旅游业已经成为世界第一大产业。我国的旅游业已纳入国家战略体系,成为快速发展的新兴战略性支柱产业。目前,旅游已经成为人民群众日常生活的重要组成部分,2018年国内旅游人数为55.39亿人次,年内人均出游约4次,数据表明,我国已经进入大众旅游时代。景区是旅游消费的吸引中心,一直备受政府、市场和旅游者关注。近年来,在旅游高峰时段,特别是“十一”、“五一”等国家法定假日期间,国内优质景区经常游客爆满,出现“井喷”现象,并时有旅游安全事故发生。为此,国家出台了很多政策加强景区管理,以提升景区内游客的安全体验。但受限于优质景区资源供给不足和景区部分设施建设滞后等综合因素的影响,游客高峰时段的景区或景区局部依然出现爆满、拥挤的场面,严重影响着景区的对外形象和游客的人身安全。在这样的背景下,景区游客高峰时段的应急管理就显得尤为重要。特别是面对非常规突发事件时,景区应该有针对性、科学性、系统性的客流调控决策。为此,本文对景区内应急管理阶段的客流调控与决策进行研究。本文的主要研究内容及结论是:第一个内容是景区应急管理与客流调控分析。首先用系统的视角分析了景区系统及其组成。随后结合公共安全理论,分析了景区应急管理客流调控的工作基础和问题内涵:对于景区的突发事件,分析了不同景区及其可能发生突发事件的类型、成因、特点和影响;对于游客和景区设施两个承灾体,分析了与客流调控紧密相关的游客个人游憩行为、客流流动规律、景区道路设施和景区信息服务设施;对于景区的应急管理,分析了景区的应急管理体系框架和应急管理预案。最后,通过对应急管理预案中的客流调控决策进行重点分析,提出景区应该建设全方位、立体化、高融合的应急管理系统;针对非常规突发事件,要建立“情景-应对”管理模式,并通过计算机仿真技术,来研究不同情景下的客流调控决策。第二个内容是景区应急管理客流调控仿真研究。首先对人群应急疏散仿真方法进行概述,并针对研究的科学问题,选用基于元胞自动机(CAM)和多Agent系统(MAS)的混合模型作为仿真模型;接着介绍了元胞自动机模型、多Agent系统模型和涟漪扩散算法(RSA),并根据景区和客流疏散的特点与现实需求,对模型和算法进行了改进;随后介绍了客流调控仿真的数据准备与收集,并通过构建景区应急管理客流调控仿真的系统框架,阐述如何获得非常规突发事件情景下的客流调控措施;最后对改进的元胞自动机模型和涟漪扩散算法进行了功能测试。第三个内容是景区应急管理客流调控决策支持研究。首先对决策支持的内涵和决策支持系统进行概述,并根据研究的科学问题,构建基于仿真的客流调控决策支持系统;接着对“情景-应对”模式下的客流调控决策进行分析,提出建设面向景区非常规突发事件下的“点-阵”式方案库,并将其与“预测-应对”模式下的限流分流等调控措施融合,形成景区应急管理客流调控的系统化决策支持;最后,基于Matlab软件实现了以颐和园“玉澜堂”为事故点,特定火灾情景下的客流调控仿真与决策研究,并初步完成颐和园景区面向应急管理的客流调控决策支持。本文的主要创新点是:(1)提出了采用系统的视角审视景区及其组成,并对景区系统进行建模和仿真,深入研究了景区的客流调控与决策;将目前的应急管理认为是“预测-应对”模式管理,并提出建设面向非常规突发事件的“情景-应对”模式应急管理,完善景区全方位、立体化、高融合的应急管理系统。(2)构建了基于元胞自动机和多Agent系统混合模型的景区客流调控仿真系统,并根据景区系统、客流的特征和景区应急管理的需求,对元胞自动机模型和涟漪扩散算法进行了改进,探索了一种快速求解景区内游客多源到多目的地最优疏散路径的方法。(3)构建了基于仿真的客流调控决策支持系统,并提出建设面向非常规突发事件的“点-阵”式方案库:“点”是不同的事故点、“阵”是每个事故点对应的情景分级分类矩阵;提出将“点-阵”式方案库与目前景区的限流分流措施相结合,形成景区应急管理客流调控的系统化决策支持。
边辰通[4](2020)在《危险交通场景下的智能汽车控制策略研究 ——主动闪避、主动减速与主动撞击》文中进行了进一步梳理基于自动驾驶系统,智能汽车能实现自主行驶,可有效减少交通事故,降低交通拥堵及环境污染,是目前国内外产业界及学术界的研究热点。智能汽车的主动安全技术是其发展及应用中面临的核心问题之一。与传统有人驾驶汽车相比,装备自动驾驶系统的智能汽车可完全控制车辆运动,这对智能汽车的主动安全技术有着更高的要求。如何为智能汽车设计完善的控制策略是智能汽车主动安全技术发展中的主要难点。当前对一些危险交通场景的研究尚不完善,基于智能汽车技术仍然可以从特定维度提高交通系统的安全水平。为此本文对传统的汽车主动安全技术的研究进行了扩展,为应对一些危险的交通场景提出了主动闪避、主动减速和主动撞击的概念,进一步扩大了智能汽车主动安全的研究领域,并围绕这些概念研究了智能汽车在交通系统中面临的若干问题,设计了相应的控制策略。具体研究内容如下:(1)提出了主动闪避、主动减速与主动撞击的概念。主动闪避是指智能汽车须尽可能避免由其他汽车原因引发的潜在交通事故。目前智能汽车的防碰撞控制系统主要有自适应巡航控制、防追尾控制及紧急制动等多种控制系统,这些系统大多关注于减少由于自身因素引起的碰撞事故,较少考虑如何减少由于其他汽车原因而引发的交通碰撞事故。这类系统在实际应用中往往无法应对诸如被后方重型汽车追尾等危险交通场景。为进一步提高智能汽车安全性,本研究提出了主动闪避的概念,并关注于在紧急情况下如何控制智能汽车纵向运动来避免由其他汽车原因造成的交通碰撞事故。主要关注于以下问题:如何避免被后方汽车追尾以及如何避免与逆行汽车发生正面碰撞事故。主动减速是指智能汽车须尽可能在检测到前方道路存在侧滑风险时,及时进行减速以降低发生侧滑事故的风险。当前汽车横摆稳定性控制的研究有助于减少汽车发生侧滑事故,然而这类研究一般仅考虑在即将或已经发生侧滑时才起作用,往往忽略通过预先减速来避免事故发生。针对该问题,本研究提出了主动减速的概念,研究通过路面附着系数估计及速度规划等措施,来降低发生侧滑事故的风险。主动撞击是指智能汽车在得到授权的情况下,主动撞击被网络入侵控制的危险汽车以避免危险汽车造成更严重的社会危害。随着智能汽车及车联网技术的发展,智能汽车的网络安全问题日益严峻。当前针对智能汽车网络安全的研究大多仅考虑网络通讯的安全,极少考虑在智能汽车被网络入侵控制并存在汽车恐怖袭击风险时的应对措施。普通警用装备很难有效阻止此类可能造成严重社会危害的危险汽车。针对该问题,本研究设计了主动撞击控制器,该控制器可在必要时控制智能汽车通过主动撞击的方式,摧毁被网络入侵控制的危险汽车。(2)针对可能发生追尾碰撞及正面碰撞事故的危险交通场景,构造了追尾碰撞闪避控制系统与正面碰撞闪避控制系统。针对四轮独立驱动电动汽车构建了考虑空气阻力及滚动阻力的纵向动力学模型,并基于该模型及模型预测控制算法设计了车辆纵向运动控制器;为降低控制器计算负荷,基于PID算法开发了纵向运动控制器。通过单车道车辆追尾事故分析,结合多Agent系统蜂拥控制理论,设计了追尾碰撞闪避控制系统;针对单车追尾碰撞闪避问题,设计了包含α-Agent、β-Ageng和γ-Agent的单层多Agent蜂拥控制结构,基于Agent之间的交互关系给出了考虑速度跟踪及防追尾功能的控制协议,并构建了单车追尾碰撞闪避轨迹规划算法;针对多车队列的追尾碰撞闪避问题,设计了采用双层蜂拥控制的多Agent系统结构,基于上下两层多Agent系统的交互关系,提出了多车队列的轨迹规划算法,可协调多辆智能汽车共同闪避后方追尾碰撞。结合对车辆正面碰撞工况的分析,给出了判断发生正面碰撞风险的决策逻辑;通过分析车辆碰撞风险,设计了单车正面碰撞闪避的轨迹规划算法;开发了多车协同轨迹规划算法,可通过协调临近车辆同步运动来降低发生正面碰撞的风险;为进一步提高车辆安全水平,研究了多车优化协同轨迹规划算法,以更充分发挥不同车辆的动力性能,使异质车辆更好地闪避正面碰撞事故。通过仿真验证了控制系统在单车及多车追尾碰撞闪避及正面碰撞闪避工况下的有效性。(3)针对存在侧滑事故风险的危险交通场景,开发了考虑路面附着系数估计的速度规划算法。在低路面附着系数高曲率的道路中,受轮胎力限制,如果车速过高则极有可能发生侧滑失稳事故。但当前极少有研究考虑在这种工况下通过预先减速来降低事故风险。本文针对该问题设计了速度规划算法。建立了包含纵向运动、横向运动、横摆运动及车轮转动的七自由度纵横耦合车辆动力学模型;结合车轮动力学模型、底盘动力学模型及车轮形变模型,研究了轮胎纵向力、横向力、车轮有效半径、滑移率及侧偏角的估计方法;基于Pacejka轮胎模型分析了轮胎力利用率等对路面附着系数估计的影响机理,指出在非剧烈运动工况下路面附着系数与轮胎力的关系;利用迭代优化方法设计了路面附着系数估计算法;考虑轮胎滑移率等因素对路面附着系数的影响,设计了自适应力矩注入方法,实现在非剧烈运动工况下准确估计路面附着系数;通过对路径等距离划分,提出了考虑侧滑、侧翻及动力学性能约束的速度优化算法,并给出了优化问题的二次规划表达形式。该速度规划算法可以在变曲率弯道工况下为智能汽车估计有效的路面附着系数,使车辆在有侧滑等危险时能够及时减速,从而降低车辆在低路面附着系数道路上发生侧滑事故的风险。利用仿真测试了速度规划算法在阶跃路面附着系数变曲率弯道工况下的有效性。(4)针对有被网络入侵控制的汽车、存在汽车恐怖袭击可能的危险交通场景,设计了智能汽车主动撞击控制器。汽车的智能化及网联化极大地方便了大众出行,但也存在着网络安全危险。在美国曾发生汽车被黑客远程入侵并控制的事件,这也导致了相关车型的大规模召回。这在很大程度上增加了国内外日益严峻的汽车恐怖袭击的风险。然而传统的警用装备很难有效应对此类汽车恐怖袭击问题。为此本研究设计了智能汽车主动撞击控制器,以在得到警方授权后主动撞击被入侵且存在恐怖袭击风险的汽车。考虑轮胎纵向力及横向力等因素,建立了包含纵向、横向及横摆运动的三自由度纵横耦合车辆动力学模型;通过对车辆相对运动的分析研究,给出了主动撞击模型的表达式;通过在当前工作点进行一阶线性化展开得到了便于控制器设计的线性模型;基于模型预测控制架构设计了主动撞击控制器。通过仿真验证了被入侵汽车以直线与曲线等不同形式运动时主动撞击控制器的有效性。(5)搭建了包含线控转向及线控驱动/制动的微缩模型汽车测试平台并进行了试验测试。利用工业铝材设计搭建了微缩模型汽车的底盘结构;采用直流电机和电机驱动器设计了模型汽车的驱动系统;结合转向舵机及RS485总线搭建了模型汽车的转向部分;使用USB数据采集卡实现了模型汽车的信号采集以及电机驱动控制功能;在笔记本计算机中基于MFC架构采用C++语言设计了正面碰撞闪避控制系统的决策、规划及控制部分。进行了试验以验证所设计的正面碰撞闪避控制系统的有效性。本研究的主要贡献在于扩展了现有智能汽车主动安全的研究领域,提出了主动闪避、主动减速和主动撞击的概念,针对若干危险交通场景设计了控制策略。主要创新点在于:(1)首次研究了车联网环境下智能汽车的追尾碰撞闪避及正面碰撞闪避控制系统,可通过及时加速、制动及倒车等操作控制单车或多车避免发生追尾及正面碰撞事故。传统车辆防碰撞研究中主要关注于防止由于自身原因导致的碰撞事故。本研究进一步考虑了如何避免由于其他车辆原因导致的追尾及正面碰撞事故。(2)首次设计了考虑路面附着系数估计的速度规划算法,可根据在线估计的路面附着系数规划安全的行车速度,从而在检测到侧滑等风险后主动减速。目前相关研究中一般仅考虑通过转向及横摆力矩控制等避免发生侧滑事故,公开资料中尚未发现基于在线估计的路面附着系数进行速度规划的研究。(3)首次开发了主动撞击控制器,可在得到授权后控制智能汽车主动撞击具有社会危害的汽车。当前公开研究中尚未见到此类有关智能汽车主动撞击控制器的研究。本文对于促进智能汽车的推广及应用,提高交通系统中整体安全水平有着积极的推动作用。
何森雨[5](2018)在《不同减排政策下工业企业低碳技术升级策略的建模优化》文中指出气候变化问题是全球关注的热点问题之一。我国作为一个负责任的大国,在气候谈判中主动承担减排责任,做出2030年单位国内生产总值二氧化碳排放比2005年下降60%-65%的承诺。工业企业作为二氧化碳的主要排放者,将因此受到政府一系列减排政策的约束,主要包括行政管制政策、碳税政策和碳交易政策等。企业在面对这些减排政策时,通过低碳技术升级从源头上减少能源使用及二氧化碳排放,是一种最根本和最有效的应对方式。然而,由于消费者需求的日益多样化,使得企业在设计和生产产品时日益精细化和复杂化,产品的生产涉及到越来越多的生产环节。因此,企业在进行技术升级时正面临着越来越多的选择,如何从中选择最优的技术升级策略已日益成为企业亟待解决的现实问题。本文在借鉴国内外相关研究的基础上,以工业企业为研究对象,分析了企业如何在不同的减排政策约束下选择最优的低碳技术升级方案,并探讨了企业间应该如何基于技术升级的方式开展合作减排。本文的主要研究内容和创新之处如下:(1)改进了“多Agent系统-遗传算法”方法,构建了一套综合考虑生产技术选择和原料供应商选择的优化模型,研究了企业在行政管制政策约束下的低碳技术选择策略。本文探讨了企业应该如何选择最优的低碳生产技术及其低碳供应商,使得企业在政府制定的碳排放刚性约束下,生产成本最低。本文构建了0-1型整数规划模型用于刻画该问题,并改进了“多Agent系统-遗传算法”方法用于该模型的求解(即IMASGA方法)。通过随机算例的验证表明,本文对IMASGA方法的改进是有效的,不仅进一步减少了计算时间,而且在一定程度上提高了计算的准确度。(2)构建了一套综合考虑短期技术升级成本和长期碳税成本的优化模型,通过算例求得了企业在碳税政策约束下的低碳技术升级路径的最优解。本文探讨了企业应该如何选择最优的生产环节使用最合理的低碳技术进行技术升级,使得技术升级成本和碳税成本之间取得平衡。本文使用0-1型整数规划模型构建了该优化模型,并提出了IMASGA+方法用于优化模型的求解。研究发现,碳税税率增加时,企业需要支付更多的技术升级成本;在企业对期望成本控制更为严格的情景中,企业对碳税税率的变化更为敏感;过高的碳税税率可能会导致企业放弃它的技术升级计划。企业的期望成本增加时,企业将减少技术升级成本的投入;在低碳税税率情景中,企业对期望成本的变化更为敏感;过高的期望成本将使得企业满足现状,不计划进行技术升级。(3)将模型的决策单元从企业整体层面细化到企业内部的生产环节,并将参与合作的企业细分为核心企业和合作企业两类,构建了一套综合考虑资金合作和技术合作的优化模型,揭示了碳税政策约束下企业基于低碳技术升级的合作减排策略的优化模式。本文先构建了独立减排模型,用于分析企业独立减排时的总成本、利润等信息;然后,基于这些基准利益,将企业细分为核心企业和合作企业两类,并通过引入资金合作和技术合作,构建了合作减排模型;通过引入多Agent系统,提出了MASE方法,用于模拟各企业之间协商,以实现合作模型的优化求解。研究发现,企业间的低碳技术合作能小幅提升各合作企业的利润,较大幅度地提升核心企业的利润,使得所有企业的整体利润大致恢复到征收碳税前的水平;在总减排资金不变的情况下,企业间的低碳技术合作能优化减排资金的分配,进一步优化企业间的减排结构,使得所有企业的整体减排量进一步下降。因此,在碳税政策下,企业间的低碳技术合作比单个企业的独立减排更具优势。(4)将碳价预测和减排决策之间的双向影响机制纳入到企业的决策模型中,构建了一套综合考虑资金合作、技术合作和减排信息共享的优化模型,揭示了企业在碳交易政策约束下基于企业间技术合作的低碳技术升级策略。本文通过构建独立减排模型,分析了各企业合作减排时的基准利益(包括利润、碳价、交易配额等信息);通过引入资金合作、技术合作和减排信息共享,构建了合作减排模式;通过引入多Agent系统,提出了MASE+方法,用于合作模型的优化求解。研究发现,企业间的低碳技术合作能够提升各企业的利润,并使各企业均有一定额度的碳配额可以出售。在碳税政策下,企业投入的减排资金越多,企业决策时将选择减排效果更好的低碳技术,使得实际的减排效果越好;但在碳交易政策下,企业的决策将受到减排资金和碳价预测值的双重影响,企业投入的减排资金越多,不一定会选择减排效果更好的低碳技术。
许珺怡[6](2017)在《基于计算辩论的多Agent联合学习方法研究》文中指出随着大数据时代的到来,分布式数据挖掘方法逐渐成为数据挖掘领域的主流技术,成为解决大规模数据环境下数据挖掘任务的基本方法之一。然而分布式数据挖掘仍有很多技术难题亟待解决。其中,分布式数据挖掘的知识集成问题关乎系统全局模式的质量优劣,得到当前分布式数据挖掘领域研究的广泛关注。因此,如何设计一种有效的知识评估与集成方法,来解决分布式数据挖掘的知识集成任务,成为富有研究价值与挑战性的前沿课题之一。本文针对分布式分类规则挖掘的知识集成问题,以多Agent系统技术为基础,综合运用多Agent辩论技术、关联规则挖掘技术、抽样技术、强化学习技术等相关领域知识,系统并深入地研究了基于计算辩论的多Agent联合学习方法的辩论模型、论据构建与性能分析,以及面对大规模数据以及动态数据的优化方法。本文的研究工作主要包括以下几个方面。(1)针对分布式数据挖掘中知识难以集成的问题,首先提出了从辩论中学习的思想,并通过理论分析、案例说明与实验验证多个角度证明了辩论具有学习能力。进而,将分布式数据挖掘与辩论技术相结合,提出了一种新的基于辩论的多Agent联合学习方法。该方法面向知识集成任务,涵盖了全局知识的抽取和优化两个主要功能,从而实现了分布式局部知识的有效集成,以及全局知识在应用阶段的更新与优化。在此基础上,使用Arena辩论模型,提出了一种基于Arena辩论模型的多Agent联合学习模型AMAJL,并从局部知识生成、全局知识生成和全局知识应用与优化三个不同层次,形式定义了AMAJL的基本功能和组成结构;最后,分析了多Agent联合学习模型AMAJL具有的重要性质。(2)为了证明基于辩论的多Agent联合学习方法的可行性与有效性,本文结合关联规则挖掘技术,对基于辩论的多Agent联合学习模型AMAJL进行了实例化,提出了基于关联规则的多Agent联合学习系统ArgAR。本文深入研究了ArgAR系统中局部规则与经验论据的实例化方法,并详细阐述基于关联规则的经验论据构建算法,以及基于关联规则的多Agent联合学习系统的主控流程与算法。最后,通过在UCI公共数据集上的大量分类实验,展示了ArgAR系统中全局知识抽取过程的收敛性,并验证ArgAR系统能够有效集成并抽取出的高质量全局知识。(3)面对大规模数据分析任务,本文将抽样技术应用于基于辩论的多Agent联合学习方法,研究并分析基于辩论的多Agent联合学习方法利用较小规模样本进行知识集成的效果。三个数据集上的分类实验表明,无论采用哪种抽样策略,基于辩论的多Agent联合学习方法中抽样比例达到50%以上,模型的分类准确度与90%抽样比例下的分类准确度仅相差5%左右。进一步表明,基于辩论的多Agent联合学习方法能够从规模较小的样本数据中抽取出高质量全局知识,有效应对大规模数据中的知识集成任务。(4)面对动态数据场景中知识集成任务,本文在基于辩论的多Agent联合学习方法的基础上,提出了一种组合强化学习的多Agent联合学习模型ArgRL,实现全局知识在动态数据的分类应用过程中的评估与优化。通过利用ε-贪婪策略进行动作选择,实现动态数据的分类过程;并借助蒙特卡罗强化学习方法,实现全局知识库在应用中动态更新与优化。在此基础上,通过在多个公共数据集上的分类实验,证明了组合强化学习的多Agent联合学习方法在动态数据环境中进行全局知识抽取与集成的可行性和有效性。
李国梁[7](2017)在《通信约束下分布式对地观测卫星系统在线协同任务调度模型与算法》文中研究表明当前对地观测需求大幅度增加,对地观测任务越来越复杂,随时会面对突发应急情况和观测环境变化,分布式对地观测卫星系统的在线协同以其星上处理、星上调度规划、星上协同为特征,充分利用系统自身的分布性和自主性,实现针对突发应急情况的快速响应、精细调度和协同观测,以提升整个系统的观测效能。论文针对通信约束下分布式对地观测卫星系统在线协同任务调度问题,主要研究了在线协同架构的设计、单星在线任务调度机制以及通信约束下的多星协同任务调度模型与算法,以满足实际应用的需求。全文主要研究成果概括如下:(1)分析并设计了面向分布式对地观测卫星系统在线协同的集中-分布式架构和分散式架构。在梳理多Agent系统协同架构与多星通用架构的基础上,明确多星在线协同所面临的实际约束、应用需求以及架构设计要点,分别设计了集中-分布式协同架构和分散式协同架构,并对架构内各Agent的智能水平与其自主功能配置,以及各Agent之间的信息流交互进行详细设计,从而为后续相应的算法机制设计奠定了基础。(2)构建了基于修订式和渐进式方法的单星在线任务调度机制。面向通信约束、计算能力约束以及动态应急任务到达,卫星网络环境下的单星在线调度问题求解分为两个决策子问题:一是何时调度,二是如何调度。针对何时调度,提出基于时域滚动与应急任务累积阈值的调度时刻混合决策机制,而针对如何调度,构建混合整数线性规划(MILP)模型,根据已提出的调度时刻混合决策机制,分别采用渐进式方法中的完全重调度策略和修订式方法中的调度计划修复策略,提出两种启发式算法。实验结果而言,对于何时调度,从进入调度求解的应急任务比例和总任务收益等性能指标上,调度时刻混合决策机制明显优于完全周期性调度机制;对于如何调度,所提出的两种算法均优于近期公开发表的多种方法。(3)针对通信约束下不同的在线协同架构,提出了多种在线协同算法。分析描述了通信约束下的同构多星在线协同调度问题,特别是对通信约束进行表述,定义了通信时间窗口、批次任务的时间可用性和应急任务的时间可用性等概念,进而构建每批应急任务到达时的子问题MILP模型;面向集中-分布式协同架构,提出了两种基于市场机制的在线协同算法:单项任务下的合同网协议算法SI-CNP和批次任务下的合同网协议算法BA-CNP;面向分散式协同架构,提出了基于同步通信的改进一致性束算法m-CBBA和基于异步通信的改进异步一致性束算法m-ACBBA。实验结果表明,当系统中的通信成本代价高时,m-CBBA算法可在系统总收益和通信次数之间取得平衡,而当系统的通信成本低时,m-ACBBA算法是获得高系统总收益和高应急任务调度成功比例的最佳选择。(4)系统地研究并求解了通信约束下面向复合任务的异构多星在线协同调度问题。首先对复合任务及其子任务约束进行分析描述,具体分为可一次性调度的前摄复合任务和需渐次性调度的渐次复合任务;然后对子问题划分,分别构建MILP模型;最后针对分散式协同架构,构建了基于通用部分全局规划GPGP的异构多星在线协同机制,对已提出的在线协同调度算法进行相应的改进。实验结果表明当通信成本高时,尽可能多搭载成像载荷更有利;要提高复合任务的任务完成度,需保证足够高的收益系数。
赵业清[8](2011)在《基于多Agent的钢铁生产复杂物流系统建模与仿真研究》文中研究指明在当前资源严重短缺,环境严重恶化,环保政策日益严格的情况下,钢铁生产企业要实现节能减排目标,进一步提高自身适应性和国际竞争能力,实现资源循环利用和本身可持续性发展,必须对企业生产物流系统进行研究、分析和优化。钢铁生产是一个多工序、多工位、空间跨度大、生产品种多的具有动态和不确定性的复杂物流系统。钢铁生产复杂物流系统是影响产品品种、质量和产量的关键因素,认识其生产物流规律,进行合理的生产计划及调度,是实现生产物流畅通的保障,是提高产品产量和降低生产成本的关键。Agent的自主性、社会性、反应性、主动性、移动性、理智性等特性可以用来实现动态的、不确定环境的、大规模的软件系统。多Agent系统把多个Agent有效组织起来,相互协作和交流,形成问题的求解环境,并根据环境和交流知识进行推理、学习等,能够有效实现系统整体性能的提高和适应系统的灵活性、柔性、开放性等要求。面向Agent的开发方法已经成为软件工程领域的新趋势,为复杂系统的理解、建模、开发提供了一种很自然的方法,它使分布式的结构变得更简单、智能化和具有鲁棒性。本文旨在利用多Agent技术探索一种既能描述钢铁生产过程复杂物流系统特性,又能反应物流系统的动态特征,并能对不同形式的钢铁生产流程具有广泛适应性的建模仿真方法和软件工程设计方法,在理论和实践方面均具有非常重要的意义。针对钢铁生产过程灵活性、柔性和适应性的要求及其物流系统的复杂性特点,根据Agent技术优势及多Agent系统优点,其应用在钢铁生产复杂物流仿真系统中时可有效克服已有建模方法的不足,提出了基于多Agent的钢铁生产复杂物流仿真系统建模方法,把钢铁生产过程复杂的物流系统抽象为一个多Agent系统,基于通用性原则对仿真系统模型进行软件工程的分析、设计与实现技术研究。首先在对钢铁生产物流系统复杂性充分认识和把握的基础上,把多Agent技术引入到钢铁生产复杂物流系统的建模过程中,实现对基于多Agent的钢铁生产复杂物流仿真系统的系统功能分层抽象和定义;其次,通过分析仿真系统中Agent类型及结构,在对Petri网结构和功能进行扩展和Agent行为理论及Agent间交互行为理论拓展的基础上,建立了仿真系统中Agent的行为及其之间的交互模型,并借助形式化描述工具Petri网实现Agent内部动作和外部动作及其之间交互的形式化建模;另外,由于钢铁生产过程中物流系统灵活性和柔性的特殊要求,致使钢铁生产过程中的运输系统在整个物流系统中具有举足轻重的地位,本文就运输系统中天车运行机制进行详细分析和研究的基础上,实现了运输系统和物流仿真系统的有机结合;最后,为确保基于多Agent的钢铁生产复杂物流仿真系统模型的有效性和正确性,在对多Agent系统工程建模方法扩展的基础上实现对复杂物流仿真系统的分析设计,建立了相应的复杂物流仿真系统模型,并进一步借助Agent建模工具实现对整个仿真系统模型的分析设计和模型验证。根据昆钢炼钢厂的生产实际,建立相应的基于多Agent的钢铁生产物流仿真模型,并将仿真结果和实际数据相对比,结果表明:①基于多Agent的钢铁生产复杂物流系统仿真模型是正确有效的,可以根据实际规模要求灵活搭建基于工序及工位的仿真模型。在相似的输入条件下,仿真结果与实际系统中转炉至连铸区间的物流平均流通时间进行对比分析进一步表明:基于多Agent的钢铁生产复杂物流系统仿真模型和实际系统没有明显差别,能正确反映炼钢厂的复杂物流实况。②基于多Agent的钢铁生产复杂物流系统仿真模型可以根据不同生产流程特点构建相应的仿真模型,仿真可揭示不同生产流程在不同生产条件下的生产瓶颈,脱硫工序在有混铁炉和取消混铁炉的炼钢生产流程中均为生产瓶颈,对于取消混铁炉的炼钢生产流程,当铁水进厂节奏较慢时(3罐/60min),脱硫工序为生产瓶颈,当铁水进厂节奏提高到一定程度(≥5罐/60min)后,转炉工序成为生产瓶颈。③利用仿真模型可为不同钢铁生产流程下制定提高生产效率、多台连铸机同时实现连浇的策略提供决策支持。比较有混铁炉和取消混铁炉的炼钢生产流程,当铁水进厂节奏比较慢时(3罐/60min),加快铁水进厂节奏或加快转炉冶炼周期有利于生产效率和连浇百分比的提高,而对于取消混铁炉的生产流程,此时较长的转炉冶炼周期反而有利于生产效率的提高;铁水进厂节奏达到一定程度后(≥5罐/60min),铁水进厂节奏或转炉冶炼周期的加快对提高生产效率和连浇百分比均没有明显效果,对于取消混铁炉的炼钢生产流程,加快转炉冶炼周期有利于提高系统生产效率。④基于多Agent的钢铁生产复杂物流系统仿真模型具有的通用性、实用性和灵活性,能正确模拟炼钢生产的复杂物流特性,可针对不同生产过程进行系统诊断和预演,根据仿真模型的仿真结果,可实现对钢铁生产组织和生产流程物流的优化管理,为全连铸生产管理及物流控制的改进提供决策支持。本文研究表明:基于多Agent的钢铁生产复杂物流系统仿真模型建模方法在表达炼钢生产物流特性、揭示复杂物流系统运行机制方面更有效,能更好的满足当前分布式复杂系统的建模需要,具有对各种炼钢生产物流系统进行灵活建模且仿真适应性较强。该建模方法的提出和实现为复杂制造流程的建模与物流仿真研究提供了新的手段和方法。
贺利坚[9](2011)在《多Agent系统中信任和信誉模型的研究》文中研究表明Agent和多Agent系统是人工智能和计算机科学领域中重要的研究方向。信任的概念来自于人类社会,是人类解决复杂问题的有效机制之一,受到多个研究领域的关注。将信任机制引入到多Agent系统的合作求解中,帮助Agent解决交互对象的选择问题,是一个很有意义的研究课题,也具有一定的应用价值。Agent是计算世界中交互实体的抽象,多Agent系统中信任的研究应当承担起发现计算实体之间信任的一般规律的任务,应该注重建立分布的Agent自主进行信任评价的一般模型。本论文研究了多Agent系统中信任和信誉模型中存在的推荐信息不准确、异构模型互操作困难等问题的解决办法,并探讨了信任机制的应用方法,主要取得了下面的研究成果:1.推荐信息不准确问题可能是由于证人主观故意撒谎,但也有可能是因为与证人无关的其他因素造成的。在现有的信誉系统中,常常将不准确信息都归咎于证人,这并不利于选择出好的目标。在多Agent系统环境的一般模型中,目标Agent的操作半径代表了与证人无关的信息不准确因素,据此提出评价者Agent从自己的角度修改证人Agent的报告的方法,以及在交互后学习到更加准确的目标Agent的操作半径的自适应算法,从而保证评价者Agent在交互中获得更高的收益。将算法用于FIRE信任模型后的实验表明,无论在静态环境,还是在动态环境,均可使评价者Agent选择出更好的交互目标,在交互中获得更高的收益。2.灰色系统理论在贫信息、不确定性问题的求解中具有优势,分布式多Agent系统具有明显的灰色特征。在建立的Gtrust模型中,设计了对证人推荐行为进行评定的方法,用灰色序列生成技术填补数据空穴,用灰色定权聚类判定对证人的信任,指导评价者Agent合理使用来自证人的推荐,克服证人提供的不准确推荐信息带来的负面影响,有效避免了包括故意欺骗在内的信息不准确因素的影响。GTrust在复杂的环境中以实际交互结果为依据的策略,是一种切合实际的选择。通过仿真实验表明,GTrust可以帮助评价者取得好的交互结果。3.在信誉的功能本体(FORe)和已有的信誉模型基础上,设计了一个用于支持异构信誉模型互操作的平台。形式化定义了平台中的评定、推荐等基本元素,使该平台能支持现有的信誉模型;区分了目标的信誉与证人的信誉,明确提出四种形式的推荐信息。这项工作将对解决多Agent系统中异构信誉模型互操作问题、开发有信誉机制的多Agent的应用系统、开展信誉模型性能测试等方面起到作用。4.目前科技文献检索和管理软件中存在缺乏合作、文献来源单一、个性化支持不足等问题。开发了一个基于Agent的文献推荐系统ALRS,以支持研究人员在搜索和共享文献过程中开展合作。在ALRS中,每名科研人员对应一个Agent,既作为检索者,又兼当推荐者。利用精心设计的交互协议和决策方法,使Agent能够选择出合适的推荐者提供文献。在交互双方的选择环节,基于已经积累的经验,引入信任度量提高了决策的效果。
杨斯博[10](2012)在《基于自组织多Agent系统的智能控制与决策研究》文中认为智能控制与决策系统的设计与实现是当前人工智能研究领域的热门问题。本文将自组织多Agent系统理论引入到智能控制与决策系统的研究中,在深入研究智能控制与决策系统相关理论及应用的基础上,设计了基于物理激励的多Agent交互模型和基于自组织多Agent系统的智能控制与决策模型,并设计和实现了一个完整的基于物理激励的自组织多Agent智能控制与决策系统平台。主要研究工作内容包括:1、系统详尽地阐述了自组织理论和多Agent系统理论的基本内容,并针对自组织理论与多Agent系统理论相互结合的问题,即多Agent系统中的自组织行为和自组织多Agent系统进行了阐述。2、提出一个基于物理激励的多Agent交互模型。该模型的基本原理是以牛顿经典物理学中的万有引力定律为基础,用人工构造的虚拟作用力作为多Agent之间交互行为的基础,通过交互场景的定义、吸引或排斥交互机制的选择、多Agent角色和行为的定义和多Agent交互过程的选择四个步骤完成建模工作。实验结果表明,该模型可以很方便的进行物理实现,并能克服传统的多Agent交互模型理论计算能力不足的缺点,具有较强的通用性和实用性。3、提出一个基于自组织多Agent系统的智能控制与决策模型及其实现算法范例。该模型由环境和自组织多Agent系统两大部分构成,通过环境的定义、环境的识别、多Agent控制与决策过程以及多Agent控制与决策输出四个基本步骤完成建模工作。该模型可以灵活地选择多种算法进行具体的实现工作,文中给出的实现算法范例在微观上以多Agent之间的交互运算为基础,宏观上以统计物理学对多Agent系统的整体统计运算为核心,充分利用了自组织多Agent系统的群体决策优势。实验结果表明,该模型及其实现算法范例可以很方便的进行物理实现,并且具有很强的灵活性和通用性。4、提出并实现了一个完整的基于物理激励的自组织多Agent智能控制与决策系统平台。该系统平台的构成是以基于物理激励的多Agent交互子系统和基于自组织多Agent系统的智能控制与决策子系统为核心,同时配以环境识别与输入子系统、控制与决策输出子系统和人机交互子系统实现具体的智能控制与决策功能。实验结果表明,该系统具有较好的有效性、灵活性、鲁棒性和适应性等特点,对于较为复杂的实时控制环境也具有较强的环境适应能力,对于实际环境中的具体应用具有可行性。5、全文最后进行了总结工作,对后续的研究工作进行了进一步设想,并对该领域的未来研究方向进行了展望。
二、支持创新概念设计的多Agent系统(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、支持创新概念设计的多Agent系统(论文提纲范文)
(1)基于强化学习的多智能体协作建模方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 研究背景 |
1.1.2 研究目的及意义 |
1.2 国内外研究现状 |
1.2.1 多Agent系统的研究现状 |
1.2.2 强化学习的研究现状 |
1.2.3 多Agent强化学习的研究现状 |
1.3 本文研究内容 |
1.4 本文的技术路线 |
1.5 本文的创新点 |
1.6 全文的组织框架 |
第2章 相关理论介绍 |
2.1 智能制造 |
2.1.1 智能制造的背景 |
2.1.2 智能制造系统对控制模型的要求 |
2.2 Agent相关技术 |
2.2.1 Agent相关概念及特性 |
2.2.2 Agent体系及结构 |
2.2.3 多Agent系统概念 |
2.2.4 多Agent系统体系结构 |
2.3 强化学习与多Agent强化学习方法 |
2.3.1 强化学习 |
2.3.2 多Agent强化学习 |
2.4 本章小结 |
第3章 面向工业的多Agent混合式智能模型 |
3.1 多Agent建模的含义和优势 |
3.2 Agent之间的通信 |
3.2.1 ACL相关介绍 |
3.2.2 利用JADE平台实现ACL |
3.3 面向工业的多Agent混合式智能模型 |
3.3.1 多Agent混合式智能模型的构建 |
3.3.2 多Agent混合式智能模型中各模块功能及主要Agent的结构 |
3.3.3 在JADE平台上构建多Agent混合式智能模型 |
3.4 本章小结 |
第4章 基于状态表示学习的多Agent协作算法 |
4.1 研究背景 |
4.2 MADDPG算法概述 |
4.3 M3DDPG算法概述 |
4.4 SRL_M3DDPG算法概述 |
4.4.1 状态表示学习 |
4.4.2 SRL_M3DDPG算法 |
4.5 仿真实验 |
4.6 本章小结 |
第5章 基于TS_Qlearning的多Agent作业调度 |
5.1 研究背景 |
5.2 作业调度问题描述 |
5.3 强化学习求解作业调度问题 |
5.3.1 调度问题中的强化学习 |
5.3.2 Q-learning算法 |
5.3.3 TS_Qlearning算法 |
5.4 仿真实验 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
在校期间主要研究成果 |
一、发表学术论文 |
二、其他科研成果 |
(2)基于多Agent的生鲜农产品物流配送路线优化研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 绪论 |
1.1 选题背景及研究意义 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 论文研究内容与技术路线 |
1.3.1 研究内容 |
1.3.2 技术路线 |
1.4 本章小结 |
2 相关概念与基础理论研究 |
2.1 生鲜农产品配送相关理论 |
2.1.1 生鲜农产品配送概述 |
2.1.2 生鲜农产品配送特点 |
2.2 配送路线优化相关理论 |
2.2.1 配送路线优化基本概述 |
2.2.2 配送路线优化问题的求解方法 |
2.3 AGENT相关理论 |
2.3.1 Agent的定义与特性 |
2.3.2 Agent的结构与原理 |
2.3.3 多Agent系统理论 |
2.4 本章小结 |
3 基于多AGENT的生鲜农产品配送系统模型 |
3.1 多AGENT结构模型设计 |
3.2 AGENT内部结构设计 |
3.3 系统扩展方案 |
3.4 本章小结 |
4 基于多AGENT的路径优化模型构建及算法研究 |
4.1 问题描述 |
4.2 静态需求下的模型构建 |
4.2.1 模型假设 |
4.2.2 模型参数 |
4.2.3 目标函数与约束条件 |
4.3 动态需求下的模型构建 |
4.4 算法设计 |
4.4.1 蚁群算法 |
4.4.2 插入算法 |
4.5 本章小结 |
5 实例分析 |
5.1 实例背景 |
5.2 模型基本数据信息收集与整理 |
5.2.1 配送中心与配送需求点位置 |
5.2.2 便利店需求量与配送时间 |
5.2.3 模型参数取值 |
5.3 算例求解结果与分析 |
5.3.1 静态需求下的求解结果 |
5.3.2 需求变动后的求解结果 |
5.4 结果扩展 |
5.4.1 调整算法参数 |
5.4.2 增加配送需求点 |
5.5 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简历及攻读硕士/博士学位期间取得的研究成果 |
学位论文数据集 |
(3)景区应急管理客流调控仿真与决策支持研究(论文提纲范文)
摘要 |
abstract |
1 绪论 |
1.1 研究背景和问题 |
1.1.1 现代旅游产业发展迅速 |
1.1.2 我国景区旅游的安全问题突出 |
1.1.3 研究问题的提出 |
1.2 研究内容与意义 |
1.2.1 研究对象 |
1.2.2 研究内容 |
1.2.3 研究意义 |
1.3 研究方法与技术路线 |
1.3.1 研究方法 |
1.3.2 技术路线 |
1.4 本章小结 |
2 文献综述与理论基础 |
2.1 文献综述 |
2.1.1 旅游应急管理研究 |
2.1.2 景区旅游流研究 |
2.1.3 文献评述 |
2.2 相关概念与理论基础 |
2.2.1 相关概念 |
2.2.2 公共安全与应急管理理论 |
2.2.3 智慧景区理论 |
2.2.4 景区客流管理相关理论 |
2.2.5 系统建模与仿真 |
2.2.6 决策理论与方法 |
2.3 本章小结 |
3 景区应急管理与客流调控分析 |
3.1 景区的再认识 |
3.1.1 景区的系统视角 |
3.1.2 景区的分类 |
3.2 景区的突发事件 |
3.2.1 景区突发事件的分类与成因 |
3.2.2 景区突发事件的特点 |
3.2.3 景区突发事件的影响 |
3.3 景区游客游憩行为 |
3.3.1 游客个人游憩行为 |
3.3.2 景区客流特征 |
3.4 景区的设施 |
3.4.1 景区设施的分类 |
3.4.2 景区道路交通设施 |
3.4.3 游客导引服务设施 |
3.4.4 景区信息服务设施 |
3.5 景区的应急管理 |
3.5.1 景区应急管理体系 |
3.5.2 景区应急管理预案 |
3.5.3 应急管理预案中的客流调控决策 |
3.6 本章小结 |
4 景区应急管理客流调控仿真研究 |
4.1 人群疏散仿真概述 |
4.2 元胞自动机模型 |
4.2.1 元胞自动机 |
4.2.2 改进的元胞自动机模型 |
4.3 多Agent系统模型 |
4.3.1 多Agent系统 |
4.3.2 景区客流调控的多Agent系统模型 |
4.4 涟漪扩散算法 |
4.4.1 客流最佳疏散路径问题 |
4.4.2 涟漪扩散算法及其改进 |
4.5 景区应急管理客流调控仿真 |
4.5.1 数据准备与收集 |
4.5.2 仿真的系统框架 |
4.5.3 数值仿真与分析 |
4.6 本章小结 |
5 景区应急管理客流调控决策支持研究 |
5.1 决策支持概述 |
5.1.1 决策支持的内涵及类型 |
5.1.2 决策支持系统 |
5.2 景区应急管理客流调控决策支持研究 |
5.2.1 基于仿真的客流调控决策支持系统 |
5.2.2 景区应急管理的客流调控决策 |
5.3 颐和园景区客流调控应急决策示例 |
5.3.1 颐和园景区概述 |
5.3.2 非常规突发事件情景构建 |
5.3.3 基础数据与模型 |
5.3.4 景区应急管理客流调控仿真 |
5.3.5 景区应急管理客流调控决策方案 |
5.4 本章小结 |
6 结论与展望 |
6.1 研究结论 |
6.2 创新点 |
6.3 研究展望 |
参考文献 |
附录 基于Matlab软件的主要算法实现 |
致谢 |
作者简介 |
(4)危险交通场景下的智能汽车控制策略研究 ——主动闪避、主动减速与主动撞击(论文提纲范文)
摘要 |
Abstract |
第1章 绪论 |
1.1 研究背景及意义 |
1.1.1 智能汽车的发展 |
1.1.2 车联网技术的发展 |
1.2 智能汽车自动驾驶系统 |
1.3 智能汽车主动安全技术 |
1.3.1 稳定性控制 |
1.3.2 防碰撞控制 |
1.4 本文主要研究内容 |
1.4.1 课题提出 |
1.4.2 研究内容 |
第2章 基于模型预测控制及PID的智能汽车纵向运动控制器 |
2.1 引言 |
2.2 汽车纵向动力学模型 |
2.3 基于模型预测控制算法的运动控制器 |
2.3.1 位置-速度跟踪控制器 |
2.3.2 速度跟踪控制器 |
2.4 基于PID算法的运动控制器 |
2.4.1 位置-速度跟踪控制器 |
2.4.2 速度跟踪控制器 |
2.5 仿真分析 |
2.6 本章小结 |
第3章 多Agent系统蜂拥运动控制策略下的单车道追尾碰撞闪避控制系统 |
3.1 引言 |
3.2 单车道追尾事故分析 |
3.3 基于多Agent系统蜂拥运动控制的追尾碰撞闪避控制系统 |
3.3.1 多Agent系统蜂拥运动控制理论 |
3.3.2 用于蜂拥运动控制的车辆纵向动力学模型 |
3.3.3 采用单层蜂拥运动控制的单车追尾闪避轨迹规划 |
3.3.4 采用双层蜂拥运动控制的多车追尾闪避轨迹规划 |
3.4 追尾碰撞闪避仿真分析 |
3.4.1 单车追尾碰撞闪避工况 |
3.4.2 多车追尾碰撞闪避工况 |
3.5 本章小结 |
第4章 考虑紧急倒车及轨迹优化的单车道正面碰撞闪避控制系统 |
4.1 引言 |
4.2 单车道正面碰撞分析 |
4.3 正面碰撞闪避控制系统结构 |
4.4 正面碰撞决策判断 |
4.5 考虑紧急倒车的轨迹规划 |
4.5.1 紧急倒车轨迹规划 |
4.5.2 协同倒车轨迹规划 |
4.5.3 优化协同倒车轨迹规划 |
4.6 正面碰撞闪避仿真分析 |
4.6.1 单车正面碰撞闪避工况 |
4.6.2 多车正面碰撞闪避工况 |
4.6.3 考虑轨迹优化的多车正面碰撞闪避工况 |
4.7 本章小结 |
第5章 考虑路面附着系数估计的变曲率弯道速度规划 |
5.1 引言 |
5.2 阶跃路面附着系数弯道速度规划问题描述 |
5.3 速度规划算法结构 |
5.4 考虑主动力矩注入的路面附着系数估计 |
5.4.1 轮胎力及车轮有效半径估计 |
5.4.2 轮胎侧偏角及滑移率计算 |
5.4.3 路面附着系数滚动优化计算 |
5.4.4 锯齿波自适应力矩注入 |
5.5 变曲率弯道速度优化 |
5.5.1 基于路径长度的决策变量 |
5.5.2 变曲率弯道速度优化约束分析与设计 |
5.5.3 速度优化目标函数 |
5.5.4 速度优化问题与求解计算 |
5.6 速度规划仿真分析 |
5.7 本章小结 |
第6章 空旷环境下智能汽车非线性主动撞击控制器 |
6.1 引言 |
6.2 智能汽车主动撞击问题描述 |
6.3 主动撞击分析与建模 |
6.3.1 平面运动车辆动力学模型 |
6.3.2 主动撞击动力学模型 |
6.4 基于非线性模型预测控制的控制器设计 |
6.4.1 模型线性化 |
6.4.2 模型预测控制器设计 |
6.5 主动撞击仿真分析 |
6.5.1 直线运动工况 |
6.5.2 曲线运动工况 |
6.6 本章小结 |
第7章 微缩模型汽车正面碰撞闪避试验 |
7.1 引言 |
7.2 微缩模型汽车搭建 |
7.2.1 四轮驱动底盘结构设计 |
7.2.2 控制系统设计 |
7.3 正面碰撞闪避试验 |
7.4 本章小结 |
第8章 总结与展望 |
8.1 研究工作总结 |
8.2 未来工作展望 |
参考文献 |
学术成果 |
致谢 |
(5)不同减排政策下工业企业低碳技术升级策略的建模优化(论文提纲范文)
摘要 |
abstract |
第1章 绪论 |
1.1 研究背景与意义 |
1.2 研究思路、主要内容与技术路线 |
1.3 论文的结构框架 |
第2章 相关文献综述 |
2.1 减排政策对企业的影响 |
2.1.1 “碳税”对企业的影响 |
2.1.2 “碳交易”对企业的影响 |
2.1.3 “行政管制”对企业的影响 |
2.2 企业碳减排管理策略 |
2.2.1 生产经营管理 |
2.2.2 低碳技术管理 |
2.2.3 低碳供应链管理 |
2.3 企业碳减排决策的优化方法 |
2.3.1 数学规划理论 |
2.3.2 多Agent系统理论 |
2.3.3 遗传算法理论 |
2.4 现有文献存在的问题 |
第3章 行政管制政策下企业低碳技术选择策略研究 |
3.1 行政管制政策下企业低碳技术选择策略的识别与建模 |
3.1.1 低碳技术策略的界定 |
3.1.2 研究的系统边界与基本假设 |
3.1.3 待解决的主要研究问题 |
3.1.4 行政管制政策下企业低碳技术选择策略的优化模型 |
3.2 改进的“多Agent系统-遗传算法”方法(IMASGA) |
3.2.1 多Agent系统模块(MAS) |
3.2.2 遗传算法模块(GA) |
3.2.3 MAS模块与GA模块的耦合 |
3.2.4 IMASGA方法的改进之处 |
3.2.5 基于IMASGA方法的软件开发 |
3.3 数值算例验证与讨论 |
3.3.1 数值算例的构造方法 |
3.3.2 数值算例描述及参数假设 |
3.3.3 数值算例的计算结果 |
3.3.4 讨论与分析 |
3.4 行政管制政策下企业低碳技术的选择策略 |
3.5 本章小结 |
第4章 碳税政策下企业技术升级策略的优化研究 |
4.1 碳税政策下企业技术升级策略优化问题的识别 |
4.1.1 技术升级策略的界定 |
4.1.2 研究的系统边界与基本假设 |
4.1.3 待解决的主要研究问题 |
4.2 碳税政策下企业技术升级策略的优化模型及其求解方法 |
4.2.1 优化模型的构建 |
4.2.2 求解方法的改造 |
4.3 数值算例验证与讨论 |
4.3.1 数值算例描述 |
4.3.2 数值算例的计算结果 |
4.3.3 鲁棒性分析 |
4.3.4 碳税税率对企业技术升级策略的影响 |
4.3.5 期望成本对企业技术升级策略的影响 |
4.4 碳税政策下企业技术升级策略的优化模式 |
4.5 本章小结 |
第5章 碳税政策下供应链中非对等企业间低碳技术合作策略的优化研究 |
5.1 碳税政策下供应链中非对等企业间低碳技术合作问题的识别 |
5.1.1 合作策略的界定 |
5.1.2 研究的系统边界与基本假设 |
5.1.3 待解决的主要研究问题 |
5.2 碳税政策下供应链中非对等企业间低碳技术合作策略的优化模型及求解方法 |
5.2.1 主要变量及其解释 |
5.2.2 独立减排模型 |
5.2.3 合作减排模型 |
5.2.4 基于多Agent系统的求解方法(MASE) |
5.2.5 基于MASE方法的软件开发 |
5.3 数值算例验证与讨论 |
5.3.1 数值算例的描述 |
5.3.2 独立减排模型的计算结果 |
5.3.3 合作减排模型的计算结果 |
5.3.4 结果讨论与分析 |
5.4 碳税政策下供应链中非对等企业间低碳技术合作策略的优化模式 |
5.5 本章小结 |
第6章 碳交易政策下供应链中非对等企业间低碳技术合作策略的优化研究 |
6.1 碳交易政策下供应链中非对等企业间低碳技术合作问题的识别 |
6.1.1 研究的系统边界 |
6.1.2 研究的基本假设 |
6.1.3 待解决的主要研究问题 |
6.2 碳交易政策下供应链非对等企业间低碳技术合作策略的优化模型及求解方法 |
6.2.1 主要变量及其解释 |
6.2.2 独立减排模型 |
6.2.3 合作减排模型 |
6.2.4 独立减排模型的求解方法 |
6.2.5 合作减排模型的求解方法 |
6.3 数值算例验证与讨论 |
6.3.1 数值算例的描述 |
6.3.2 独立减排模型的计算结果 |
6.3.3 合作减排模型的计算结果 |
6.3.4 碳交易政策和碳税政策对企业技术升级策略的影响比较 |
6.4 碳交易政策下供应链中非对等企业间低碳技术合作策略的优化模式 |
6.5 本章小结 |
第7章 全文总结与展望 |
7.1 研究的主要结论 |
7.2 研究的主要创新工作 |
7.3 研究的启示与建议 |
7.4 研究的局限与展望 |
参考文献 |
附录 |
附录A 第3章算例的原始数据和部分计算结果 |
附录B 第5章和第6章算例的原始数据 |
攻读学位期间发表论文与研究成果清单 |
致谢 |
作者简介 |
(6)基于计算辩论的多Agent联合学习方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 基于多Agent的分布式数据挖掘 |
1.2.2 基于辩论技术的数据挖掘方法 |
1.2.3 分布式数据挖掘中的知识集成方法 |
1.3 本文主要工作 |
1.3.1 主要研究工作与创新点 |
1.3.2 论文的组织结构 |
第二章 多Agent从辩论中联合学习的方法 |
2.1 面向知识集成的联合学习 |
2.2 知识螺旋模型 |
2.3 从辩论中学习 |
2.3.1 多Agent辩论的学习能力分析 |
2.3.2 辩论学习的案例 |
2.3.3 辩论学习算法的实验验证 |
2.4 多Agent的联合学习方法 |
2.5 基于Arena的多Agent联合学习模型AMAJL |
2.5.1 Arena辩论模型简介 |
2.5.2 分布式多Agent数据挖掘系统 |
2.5.3 多Agent辩论学习器 |
2.5.4 双方论据博弈过程 |
2.5.5 多方论据博弈过程 |
2.5.6 联合学习模型AMAJL |
2.5.7 全局知识库及其优化 |
2.5.8 AMAJL具有的性质 |
2.6 本章小结 |
第三章 基于关联规则的多Agent联合学习系统 |
3.1 大数据条件下的关联规则挖掘 |
3.2 关联规则挖掘的基本原理 |
3.3 基于关联规则的局部规则与经验论据实例化 |
3.3.1 局部规则的实例化 |
3.3.2 经验论据的实例化 |
3.4 基于关联规则的经验论据构建算法 |
3.4.1 主论据的构建 |
3.4.2 攻击论据的构建 |
3.5 基于关联规则的多Agent联合学习主控流程与算法 |
3.6 ArgAR实验分析 |
3.6.1 实验准备工作 |
3.6.2 收敛性分析 |
3.6.3 TCV对比分析 |
3.6.4 参数分析 |
3.7 本章小结 |
第四章 结合抽样的多Agent联合学习方法 |
4.1 引言 |
4.2 数据挖掘中的抽样技术 |
4.2.1 数据挖掘中的抽样方法 |
4.2.2 当前的研究进展 |
4.2.3 本文关注的抽样策略 |
4.3 在多Agent联合学习方法中应用抽样技术 |
4.3.1 应用方法 |
4.3.2 多Agent联合学习方法在小样本中的优势分析 |
4.4 实验分析 |
4.4.1 抽样策略设置 |
4.4.2 抽样策略对比 |
4.4.3 实验结果分析 |
4.5 本章小结 |
第五章 组合强化学习的多Agent联合学习方法 |
5.1 引言 |
5.2 蒙特卡罗强化学习方法 |
5.3 组合强化学习的多Agent联合学习模型 |
5.3.1 问题建模 |
5.3.2 ArgRL的工作过程 |
5.3.3 状态空间的泛化 |
5.3.4 应用评估值的更新 |
5.3.5 动作选择策略 |
5.3.6 应用n臂赌博机模型的合理性分析 |
5.3.7 ArgRL主控算法 |
5.4 ArgRL的实验分析 |
5.4.1 实验准备 |
5.4.2 收敛性分析 |
5.4.3 分类性能对比 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 本文主要研究成果 |
6.2 未来工作展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
(7)通信约束下分布式对地观测卫星系统在线协同任务调度模型与算法(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.2.1 分布式对地观测卫星系统 |
1.2.2 单星自主任务调度规划研究现状 |
1.2.3 多星协同任务调度规划研究现状 |
1.2.4 多机器人系统协同任务分配研究现状 |
1.2.5 当前研究存在的问题与解决思路 |
1.3 论文组织结构与创新点 |
1.3.1 论文主要内容与组织结构 |
1.3.2 论文创新点 |
第二章 基于多Agent系统的分布式对地观测卫星系统在线协同架构设计 |
2.1 Agent与多Agent系统 |
2.1.1 Agent |
2.1.2 多Agent系统 |
2.1.3 多Agent系统协同架构 |
2.2 通信约束下基于多Agent系统的在线协同架构分析与设计 |
2.2.1 约束与需求分析 |
2.2.2 协同架构设计要点分析 |
2.2.3 集中-分布式多星协同架构 |
2.2.4 分散式多星协同架构 |
2.3 本章小结 |
第三章 基于修订式和渐进式方法的单星在线任务调度机制 |
3.1 问题描述 |
3.2 调度时刻混合决策机制 |
3.3 调度模型与算法设计 |
3.3.1 模型构建 |
3.3.2 求解策略 |
3.3.3 启发式算法 |
3.4 实验设计与结果 |
3.4.1 实验设计 |
3.4.2 针对何时调度的结果分析 |
3.4.3 针对如何调度的结果分析 |
3.5 本章小结 |
第四章 通信约束下面向简单任务的同构多星在线协同 |
4.1 问题描述与数学模型 |
4.1.1 问题描述 |
4.1.2 数学模型 |
4.2 面向集中-分布式架构的在线协同算法 |
4.2.1 单项任务下的合同网协议算法 |
4.2.2 批次任务下的合同网协议算法 |
4.3 面向分散式架构的在线协同算法 |
4.3.1 基于同步通信的改进一致性束算法 |
4.3.2 基于异步通信的改进异步一致性束算法 |
4.4 应用实例 |
4.4.1 实例设计 |
4.4.2 结果分析 |
4.5 本章小结 |
第五章 通信约束下面向复合任务的异构多星在线协同 |
5.1 问题描述 |
5.1.1 前摄复合任务 |
5.1.2 渐次复合任务 |
5.2 数学模型 |
5.3 基于GPGP的异构多星在线协同机制 |
5.4 应用实例 |
5.4.1 实例设计 |
5.4.2 面向前摄复合任务的实例结果分析 |
5.4.3 面向渐次复合任务的实例结果分析 |
5.5 本章小结 |
第六章 总结与展望 |
6.1 论文工作总结 |
6.2 进一步工作展望 |
致谢 |
参考文献 |
作者在学期间取得的学术成果 |
作者在学期间参加的科研项目 |
(8)基于多Agent的钢铁生产复杂物流系统建模与仿真研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 引言 |
1.2 钢铁生产物流系统概述 |
1.2.1 钢铁生产流程概述 |
1.2.2 钢铁生产流程特点及复杂性 |
1.2.3 钢铁生产复杂物流系统 |
1.2.4 复杂系统理论和研究方法 |
1.3 钢铁生产复杂物流系统研究现状 |
1.3.1 钢铁生产复杂物流与生产调度关系 |
1.3.2 钢铁生产调度问题主要研究方法 |
1.3.3 钢铁生产复杂物流系统研究方法 |
1.3.4 钢铁生产复杂物流系统及生产调度系统研究现状 |
1.4 本文主要研究内容及创新点 |
1.4.1 论文研究思路 |
1.4.2 论文主要研究内容 |
1.4.3 论文的创新点 |
第二章 Agent建模理论与仿真方法 |
2.1 引言 |
2.2 多Agent系统概述 |
2.2.1 Agent技术 |
2.2.2 多Agent系统 |
2.3 多Agent系统建模与仿真 |
2.3.1 多Agent系统建模 |
2.3.2 多Agent系统仿真 |
2.4 小结 |
第三章 钢铁生产复杂物流多Agent建模与仿真 |
3.1 钢铁生产流程分析 |
3.2 钢铁生产复杂物流系统多Agent仿真模型 |
3.2.1 钢铁生产复杂物流多Agent系统 |
3.2.2 钢铁生产复杂物流系统Agent类型和结构 |
3.3 钢铁生产复杂物流多Agent仿真模型关键技术 |
3.3.1 Agent关系描述 |
3.3.2 Agent通信描述 |
3.3.3 Agent行为Petri网建模 |
3.3.4 Agent交互行为Petri网建模 |
3.4 钢铁生产复杂物流多Agent运输系统 |
3.4.1 运输系统重要性分析 |
3.4.2 运输系统特点分析 |
3.4.3 运输系统中工序和工位关系描述 |
3.5 小结 |
第四章 钢铁生产复杂物流多Agent仿真系统设计 |
4.1 MaSE方法和AgentTool工具介绍 |
4.1.1 MaSE方法简介 |
4.1.2 AgentTool工具简介 |
4.2 基于MaSE的钢铁生产复杂物流仿真系统设计 |
4.2.1 钢铁生产复杂物流仿真模型的系统目标获取 |
4.2.2 钢铁生产复杂物流仿真系统应用用例设计 |
4.2.3 钢铁生产复杂物流仿真系统中角色提炼 |
4.2.4 仿真系统中Agent类的创建 |
4.2.5 仿真系统中Agent间对话的构建 |
4.2.6 仿真系统中Agent类的设计与组装 |
4.2.7 系统设计 |
4.3 小结 |
第五章 钢铁生产复杂物流多Agent仿真系统实现 |
5.1 系统开发平台 |
5.1.1 基于AnyLogic平台的Agent的建模方法 |
5.1.2 基于AnyLogic平台的Agent交互 |
5.2 系统设计概述 |
5.2.1 系统设计背景 |
5.2.2 系统设计目标 |
5.3 系统总体设计 |
5.3.1 仿真模型结构功能设计 |
5.3.2 数据库设计 |
5.4 系统软件实现 |
5.4.1 仿真模型的程序实现 |
5.4.2 参数设定与模型仿真界面 |
5.4.3 模型运行结果表达 |
5.5 小结 |
第六章 钢铁生产复杂物流多Agent仿真模型检验与仿真实验 |
6.1 仿真模型检验 |
6.1.1 昆钢生产工艺数据统计分析 |
6.1.2 仿真条件 |
6.1.3 仿真结果 |
6.2 生产条件对生产过程的影响 |
6.2.1 仿真实验设计 |
6.2.2 生产模式Ⅰ仿真分析 |
6.2.3 生产模式Ⅱ仿真分析 |
6.3 小结 |
第七章 总结与展望 |
7.1 论文工作总结 |
7.2 工作展望 |
致谢 |
参考文献 |
附录A (攻读博士学位期间发表的论文专利) |
附录B |
(9)多Agent系统中信任和信誉模型的研究(论文提纲范文)
致谢 |
中文摘要 |
ABSTRACT |
表格索引 |
插图索引 |
1 绪论 |
1.1 Agent和多Agent系统 |
1.1.1 Agent |
1.1.2 多Agent系统 |
1.1.3 多Agent系统中的合作求解 |
1.1.4 多Agent系统开发 |
1.2 信任的基本概念 |
1.3 灰色系统理论简介 |
1.4 论文的主要工作及创新 |
1.5 论文的组织结构 |
2 多Agent系统中信任和信誉模型的研究进展 |
2.1 多Agent系统中的信任和信誉模型 |
2.1.1 多Agent系统中信任的概念 |
2.1.2 信誉和信誉模型 |
2.1.3 信任和信誉模型在多Agent系统合作中的意义 |
2.1.4 相关的研究主题 |
2.1.5 信任研究的团队和组织 |
2.2 信任和信誉模型的研究 |
2.2.1 信任问题的研究内容 |
2.2.2 信誉模型的性能要求 |
2.2.3 信誉模型的测试和开发平台 |
2.2.4 信誉模型的应用 |
2.3 信任和信誉模型的技术 |
2.3.1 信任的表示和度量方法 |
2.3.2 信誉模型的体系结构 |
2.3.3 信任的汇总 |
2.4 几个相关问题 |
2.4.1 群体信誉 |
2.4.2 信息不准确问题 |
2.4.3 信息贫乏问题 |
2.4.4 异构系统互操作问题 |
2.5 小结 |
3 信任模型中不准确信息的修正方法研究 |
3.1 问题定义 |
3.1.1 交互实体及其信任 |
3.1.2 Agent间的交互和评定 |
3.1.3 证人及提供的推荐信息 |
3.2 证人报告的修正 |
3.2.1 多Agent系统环境模型 |
3.2.2 影响报告准确性的因素 |
3.2.3 对证人评定的修正 |
3.3 目标操作半径的学习算法 |
3.4 实验设置与分析 |
3.4.1 实验设置 |
3.4.2 动态环境的设置 |
3.4.3 实验结果及分析 |
3.5 小结 |
4 GTrust:一种基于灰色系统的分布式信任模型 |
4.1 Agent及其交互 |
4.1.1 交互Agent实体及评价属性 |
4.1.2 对与目标Agent交互的评定 |
4.1.3 对证人的评定 |
4.1.4 引入信任模型后Agent的交互过程 |
4.2 对目标的信任 |
4.2.1 对目标的直接信任 |
4.2.2 对目标的间接信任 |
4.2.3 计算对目标的信任 |
4.3 对证人的信任 |
4.3.1 评定证人方法 |
4.3.2 填补数据序列中的空穴 |
4.3.3 计算对证人的信任 |
4.4 实验及结果分析 |
4.4.1 多Agent系统环境和配置 |
4.4.2 实验结果 |
4.5 相关工作 |
4.6 小结 |
5 一个支持信誉模型互操作的多Agent平台 |
5.1 信誉的功能性本体——FORe |
5.2 平台描述 |
5.2.1 Agent和角色 |
5.2.2 直接经验 |
5.2.3 推荐信息 |
5.2.4 推荐内容的形式 |
5.2.5 信誉的汇总 |
5.2.6 证人的信誉 |
5.3 案例:FIRE信誉模型在平台上的实现 |
5.4 Agent的结构与实现 |
5.4.1 Agent的结构 |
5.4.2 平台的实现 |
5.5 小结 |
6 基于Agent的文献推荐系统——ALRS |
6.1 引言 |
6.2 系统模型 |
6.3 ARLS的体系结构 |
6.4 文献合作搜索过程 |
6.5 合作过程中的决策 |
6.5.1 相似性 |
6.5.2 向谁请求帮助 |
6.5.3 是否接受搜索请求 |
6.5.4 由谁提供搜索结果 |
6.5.5 交互质量如何 |
6.6 ARLS原型系统的实现 |
6.7 小结 |
7 总结与展望 |
7.1 本文总结 |
7.2 展望及今后的工作 |
参考文献 |
攻读博士学位期间发表的学术论文 |
学位论文数据集 |
(10)基于自组织多Agent系统的智能控制与决策研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题背景及研究意义 |
1.1.1 选题背景 |
1.1.2 研究意义 |
1.2 国内外研究综述 |
1.2.1 智能控制与决策概述 |
1.2.2 智能交通系统与智能车辆概述 |
1.2.3 国内外ITS 研究综述 |
1.2.4 国内外智能车辆研究综述 |
1.2.5 国内外车辆避撞系统研究综述 |
1.2.6 国内外研究现状的比较分析 |
1.3 存在的问题 |
1.4 本文主要研究内容及创新点 |
1.4.1 本文主要研究内容 |
1.4.2 创新点 |
第二章 自组织理论与多AGENT 系统理论基础 |
2.1 自组织理论概述 |
2.1.1 复杂系统概述 |
2.1.2 自组织与自组织系统概述 |
2.1.3 自组织系统中的涌现现象和间接通信 |
2.2 多AGENT 系统理论基础 |
2.2.1 多Agent 系统理论的形成 |
2.2.2 Agent 和智能Agent |
2.2.3 Agent 的分类及内部结构 |
2.2.4 Agent 的环境与交互 |
2.2.5 多Agent 系统 |
2.3 多AGENT 系统中的自组织行为 |
2.4 自组织AGENT 与自组织多AGENT 系统 |
2.5 本章小结 |
第三章 基于物理激励的多AGENT 交互模型 |
3.1 相关研究概述 |
3.2 基于物理激励的多AGENT 交互机制 |
3.2.1 基本原理 |
3.2.2 应用范围 |
3.3 基于物理激励的多AGENT 交互模型的定义 |
3.3.1 交互场景的定义 |
3.3.2 基于物理激励的交互机制的选择 |
3.3.3 多Agent 角色和行为的定义 |
3.3.4 多Agent 交互过程的选择 |
3.3.5 模型参数的定义 |
3.4 基于物理激励的多AGENT 交互模型计算实验 |
3.4.1 车辆避撞场景的分析 |
3.4.2 基于物理激励的多Agent 避撞交互机制的选择 |
3.4.3 Agent 角色和行为的分析 |
3.4.4 多Agent 交互过程的选择 |
3.4.5 模型参数设定及实验测试 |
3.5 基于物理激励的多AGENT 交互模型优劣势分析 |
3.6 本章小结 |
第四章 基于自组织多AGENT 系统的智能控制与决策模型 |
4.1 相关研究概述 |
4.2 基于自组织多AGENT 系统的智能控制与决策模型的体系结构 |
4.3 基于自组织多AGENT 系统的智能控制与决策全过程 |
4.3.1 环境的定义 |
4.3.2 环境的识别 |
4.3.3 多Agent 控制与决策过程 |
4.3.4 多Agent 控制与决策输出 |
4.3.5 模型参数的定义 |
4.4 基于自组织多AGENT 系统的智能控制与决策模型计算实验 |
4.4.1 车辆避撞环境的定义 |
4.4.2 车辆避撞环境的识别 |
4.4.3 多Agent 车辆避撞控制与决策过程分析 |
4.4.4 多Agent 车辆避撞控制与决策输出分析 |
4.4.5 模型参数设定及实验测试 |
4.5 基于自组织多AGENT 系统的智能控制与决策模型优劣势分析 |
4.6 本章小结 |
第五章 基于物理激励的自组织多AGENT 智能控制与决策系统及其应用 |
5.1 相关研究概述 |
5.2 基于物理激励的自组织多AGENT 智能控制与决策系统总体结构 |
5.3 基于物理激励的自组织多AGENT 智能控制与决策系统构成 |
5.3.1 人机交互子系统 |
5.3.2 系统环境识别与输入子系统 |
5.3.3 基于物理激励的多Agent 交互子系统 |
5.3.4 基于自组织多Agent 的智能控制与决策子系统 |
5.3.5 控制与决策输出子系统 |
5.3.6 系统参数的定义与划分 |
5.4 基于物理激励的自组织多AGENT 智能控制与决策系统实现 |
5.4.1 面向多Agent 系统的软件工程方法概述 |
5.4.2 基于物理激励的自组织多Agent 智能控制与决策系统平台的分析和设计 |
5.4.3 基于物理激励的自组织多Agent 系统智能控制与决策系统平台的实现 |
5.5 面向智能车辆避撞系统应用的综合模拟实验测试 |
5.5.1 系统参数的设定 |
5.5.2 实验测试1 - 固定障碍物有效性模拟实验 |
5.5.3 实验测试2 - 移动障碍物有效性模拟实验 |
5.5.4 实验测试3 - 系统适应性及稳定性模拟实验 |
5.5.5 实验结果分析与评价 |
5.6 本章小结 |
第六章 总结与展望 |
6.1 论文研究工作总结 |
6.2 今后研究工作展望 |
参考文献 |
发表论文和参加科研情况说明 |
致谢 |
四、支持创新概念设计的多Agent系统(论文参考文献)
- [1]基于强化学习的多智能体协作建模方法研究[D]. 胡大鹏. 齐鲁工业大学, 2021(10)
- [2]基于多Agent的生鲜农产品物流配送路线优化研究[D]. 李庭阁. 北京交通大学, 2020(03)
- [3]景区应急管理客流调控仿真与决策支持研究[D]. 张公鹏. 中国矿业大学(北京), 2020(01)
- [4]危险交通场景下的智能汽车控制策略研究 ——主动闪避、主动减速与主动撞击[D]. 边辰通. 东南大学, 2020
- [5]不同减排政策下工业企业低碳技术升级策略的建模优化[D]. 何森雨. 北京理工大学, 2018(06)
- [6]基于计算辩论的多Agent联合学习方法研究[D]. 许珺怡. 国防科技大学, 2017
- [7]通信约束下分布式对地观测卫星系统在线协同任务调度模型与算法[D]. 李国梁. 国防科技大学, 2017(02)
- [8]基于多Agent的钢铁生产复杂物流系统建模与仿真研究[D]. 赵业清. 昆明理工大学, 2011(05)
- [9]多Agent系统中信任和信誉模型的研究[D]. 贺利坚. 北京交通大学, 2011(09)
- [10]基于自组织多Agent系统的智能控制与决策研究[D]. 杨斯博. 天津大学, 2012(07)