自动化技术论文_基于组合训练的规则嵌入多智能体强化学习方法_工业_论文导航

自动化技术论文_基于组合训练的规则嵌入多智能体强化学习方法

更新日期：2021-11-17 来源：产业与环境浏览次数：45 在线投稿

核心提示：文章摘要:多智能体强化学习方法在仿真模拟、游戏对抗、推荐系统等许多方面取得了突出的进展。然而，现实世界的复杂问题使得强化

文章摘要:多智能体强化学习方法在仿真模拟、游戏对抗、推荐系统等许多方面取得了突出的进展。然而，现实世界的复杂问题使得强化学习方法存在无效探索多、训练速度慢、学习能力难以持续提升等问题。该研究嵌入规则的多智能体强化学习技术，提出基于组合训练的规则与学习结合的方式，分别设计融合规则的多智能体强化学习模型与规则选择模型，通过组合训练将二者有机结合，能够根据当前态势决定使用强化学习决策还是使用规则决策，有效解决在学习中使用哪些规则以及规则使用时机的问题。依托中国电子科技集团发布的多智能体对抗平台，对提出的方法进行实验分析和验证。通过与内置对手对抗，嵌入规则的方法经过约1.4万局训练就收敛到60%的胜率而没有嵌入规则的算法需要约1.7万局的时候收敛到50%的胜率，结果表明嵌入规则的方法能够有效提升学习的收敛速度和最终效果。

文章关键词:

项目基金:国家自然科学基金资助项目,

论文作者:李渊徐新海

作者单位:军事科学院

论文DOI: 10.19734/j.issn.1001-3695.2021.09.0351

论文分类号: TP18

相关文献:多智能体强化学习综述.《计算机科学》
深度强化学习综述.《计算机学报》

相似文献:多智能体深度强化学习研究综述.....作者:孙彧,曹雷,陈希亮,徐志雄,赖俊,刊载期刊：《计算机工程与应用》
数据驱动的多智能体网络鲁棒包容控制.....作者:于镝,刊载期刊：《控制理论与应用》
基于零和博弈的多智能体网络鲁棒包容控制.....作者:于镝,刊载期刊：《控制与决策》
一种基于深度强化学习的多智能体协作方法.....作者:厉子凡,王浩,方宝富,刊载期刊：《计算机工程》
多智能体协作场景下基于强化学习值分解的计算卸载策略.....作者:张鹏,田辉,赵鹏涛,贺硕,童一帆,刊载期刊：《通信学报》
面向车联网多智能体强化学习边云协同卸载.....作者:叶佩文,贾向东,杨小蓉,牛春雨,刊载期刊：《计算机工程》
基于优先经验回放的多智能体协同算法.....作者:黄子蓉,甯彦淞,王莉,刊载期刊：《太原理工大学学报》
基于过滤机制筛选信息的多智能体策略方法研究.....作者:陈亮,郭婷,刘韵婷,杨佳明,刊载期刊：《控制与决策》
基于多智能体混沌鸟群算法的机构优化.....作者:吴冬梅,郝凤鸣,蒋国平,刊载期刊：《信息与控制》
基于分布式自适应的多智能体容错一致性控制.....作者:张普,薛惠锋,高山,刊载期刊：《航空学报》

相关文章:人工智能在智能制造中的应用.....作者:杨磊
大数据人工智能驱动图书馆知识服务和学科建设.....作者:姜爱蓉
商业航天背景下的遥感应用产业化.....作者:刘东升
Artificial Intelligence: Where Maybe Next Steps? “人工智能热”之后的冷静思考.....作者:Tony Qiu
Computational Analysis of the Voynich Manuscript 十五世纪伏尼契码的智能解析.....作者:Greg Kondrak
深度强化学习系列课程第四讲.....作者:汪荣贵
北京二号遥感卫星星座及其应用服务.....作者:屈鸿钧
第一讲：人工智能时代的刑事责任演变：过去·现在·将来.....作者:刘宪权

上一篇：临床医学论文_改进YOLOv5的白细胞检测算法

下一篇：机械工业论文_齿轮接触疲劳理论研究进展