人机所团队获2021年腾讯开悟多智能体强化学习大赛季军 - 新闻动态 - 兰 旭光
人机所团队获2021年腾讯开悟多智能体强化学习大赛季军
4月14日,第二届“腾讯开悟多智能体强化学习大赛”决赛在成都落幕,来自20多所顶尖高校的AI研发团队,经过半年来的比拼,共有4支团队进入决赛。经过激烈角逐,由兰旭光教授指导的XJTU_太初队荣获本届大赛季军。
本次比赛遵循王者荣耀游戏环境规则:玩家(智能体)将被分成两个阵容,并从地图的两端同时发起攻击。玩家(智能体)将控制他们的英雄互相合作,获取资源并击败他们的对手。胜利条件为摧毁敌人总部的水晶。
(1) 初赛 - 1v1 墨家机关道
参赛队伍需要在指定的时间内,在给定的资源下训练露娜、鲁班七号、橘右京等三位英雄的最优模型,并最终部署好使用最优模型的AI服务器,提交系统进行墨家机关道1v1对战。初赛主要考查单智能体解决方案,模型结构设计,强化学习算法设计和训练方式探索。
(2) 复赛与决赛 - 3v3 长平攻防战
参赛队伍需要在指定的时间内,在给定的资源下训练出赵云、李元芳、貂蝉等三位英雄的最优模型,并最终部署好使用最优模型的AI服务器,提交系统进行长平攻防战3v3对战。
相比于初赛,复赛与决赛涉及到多智能体解决方案(更强调AI之间的配合协作),并且比赛使用的游戏环境具有更大的状态空间,需要更复杂的模型结构与强化学习算法。此外,参赛选手还要考虑奖励函数设计,训练方式探索等内容。
新
News List
闻列表
-
2023
12-04
-
2023
10-04
-
2023
08-10
-
2023
07-20
-
2023
06-01
-
2023
05-10