首页 > 论文导航 > 工业
自动化技术论文_基于组合训练的规则嵌入多智能体强化学习方法
 
更新日期:2021-11-17   来源: 产业与环境   浏览次数:45   在线投稿
 

核心提示:文章摘要:多智能体强化学习方法在仿真模拟、游戏对抗、推荐系统等许多方面取得了突出的进展。然而,现实世界的复杂问题使得强化

 

文章摘要:多智能体强化学习方法在仿真模拟、游戏对抗、推荐系统等许多方面取得了突出的进展。然而,现实世界的复杂问题使得强化学习方法存在无效探索多、训练速度慢、学习能力难以持续提升等问题。该研究嵌入规则的多智能体强化学习技术,提出基于组合训练的规则与学习结合的方式,分别设计融合规则的多智能体强化学习模型与规则选择模型,通过组合训练将二者有机结合,能够根据当前态势决定使用强化学习决策还是使用规则决策,有效解决在学习中使用哪些规则以及规则使用时机的问题。依托中国电子科技集团发布的多智能体对抗平台,对提出的方法进行实验分析和验证。通过与内置对手对抗,嵌入规则的方法经过约1.4万局训练就收敛到60%的胜率而没有嵌入规则的算法需要约1.7万局的时候收敛到50%的胜率,结果表明嵌入规则的方法能够有效提升学习的收敛速度和最终效果。

文章关键词:

项目基金:国家自然科学基金资助项目,

论文作者:李渊 徐新海 

作者单位:军事科学院 

论文DOI: 10.19734/j.issn.1001-3695.2021.09.0351

论文分类号: TP18

相关文献:多智能体强化学习综述.《计算机科学》
深度强化学习综述.《计算机学报》

相似文献:多智能体深度强化学习研究综述.....作者:孙彧,曹雷,陈希亮,徐志雄,赖俊,刊载期刊:《计算机工程与应用》
数据驱动的多智能体网络鲁棒包容控制.....作者:于镝,刊载期刊:《控制理论与应用》
基于零和博弈的多智能体网络鲁棒包容控制.....作者:于镝,刊载期刊:《控制与决策》
一种基于深度强化学习的多智能体协作方法.....作者:厉子凡,王浩,方宝富,刊载期刊:《计算机工程》
多智能体协作场景下基于强化学习值分解的计算卸载策略.....作者:张鹏,田辉,赵鹏涛,贺硕,童一帆,刊载期刊:《通信学报》
面向车联网多智能体强化学习边云协同卸载.....作者:叶佩文,贾向东,杨小蓉,牛春雨,刊载期刊:《计算机工程》
基于优先经验回放的多智能体协同算法.....作者:黄子蓉,甯彦淞,王莉,刊载期刊:《太原理工大学学报》
基于过滤机制筛选信息的多智能体策略方法研究.....作者:陈亮,郭婷,刘韵婷,杨佳明,刊载期刊:《控制与决策》
基于多智能体混沌鸟群算法的机构优化.....作者:吴冬梅,郝凤鸣,蒋国平,刊载期刊:《信息与控制》
基于分布式自适应的多智能体容错一致性控制.....作者:张普,薛惠锋,高山,刊载期刊:《航空学报》

相关文章:人工智能在智能制造中的应用.....作者:杨磊
大数据人工智能驱动图书馆知识服务和学科建设.....作者:姜爱蓉
商业航天背景下的遥感应用产业化.....作者:刘东升
Artificial Intelligence: Where Maybe Next Steps? “人工智能热”之后的冷静思考.....作者:Tony Qiu
Computational Analysis of the Voynich Manuscript 十五世纪伏尼契码的智能解析.....作者:Greg Kondrak
深度强化学习系列课程第四讲.....作者:汪荣贵
北京二号遥感卫星星座及其应用服务.....作者:屈鸿钧
第一讲:人工智能时代的刑事责任演变: 过去·现在·将来.....作者:刘宪权

 

上一篇:临床医学论文_改进YOLOv5的白细胞检测算法

下一篇: 机械工业论文_齿轮接触疲劳理论研究进展

 
相关论文导读
 
发布日期:2022-05-26 来源: 浏览次数:123
 
 
发布日期:2022-05-26 来源: 浏览次数:108
 
 
发布日期:2022-05-26 来源: 浏览次数:116
 
 
 
 
发布日期:2022-05-26 来源: 浏览次数:120
 
 
发布日期:2022-05-26 来源: 浏览次数:118
 
 
 
发布日期:2022-05-26 来源: 浏览次数:131
 
 
发布日期:2022-05-26 来源: 浏览次数:116
 
分类浏览
 
论文阅读排行
 
最新论文阅读
 
 
 



2018-2020 400农业期刊网 专业学术期刊名单推荐平台

 

免责声明:本平台并非任何杂志官网,仅限于整理学术信息以及期刊投稿渠道