校内登录

个人信息 更多+
  • 教师姓名: 兰旭光
  • 电子邮箱:
  • 所在单位: 人工智能学院
  • 学历: 博士研究生毕业
  • 性别: 男
  • 学位: 博士
  • 职称: 教授
  • 博士生导师: 是
  • 硕士生导师: 是

当前位置: 中文主页 - 新闻动态

人机所团队获2021年腾讯开悟多智能体强化学习大赛季军

发布时间:2022-05-14
点击次数:
发布时间:
2022-05-14
文章标题:
人机所团队获2021年腾讯开悟多智能体强化学习大赛季军
内容:

4月14日,第二届“腾讯开悟多智能体强化学习大赛”决赛在成都落幕,来自20多所顶尖高校的AI研发团队,经过半年来的比拼,共有4支团队进入决赛。经过激烈角逐,由兰旭光教授指导的XJTU_太初队荣获本届大赛季军。

本次比赛遵循王者荣耀游戏环境规则:玩家(智能体)将被分成两个阵容,并从地图的两端同时发起攻击。玩家(智能体)将控制他们的英雄互相合作,获取资源并击败他们的对手。胜利条件为摧毁敌人总部的水晶。

(1) 初赛 - 1v1 墨家机关道

参赛队伍需要在指定的时间内,在给定的资源下训练露娜、鲁班七号、橘右京等三位英雄的最优模型,并最终部署好使用最优模型的AI服务器,提交系统进行墨家机关道1v1对战。初赛主要考查单智能体解决方案,模型结构设计,强化学习算法设计和训练方式探索。

(2) 复赛与决赛 - 3v3 长平攻防战

参赛队伍需要在指定的时间内,在给定的资源下训练出赵云、李元芳、貂蝉等三位英雄的最优模型,并最终部署好使用最优模型的AI服务器,提交系统进行长平攻防战3v3对战。

相比于初赛,复赛与决赛涉及到多智能体解决方案(更强调AI之间的配合协作),并且比赛使用的游戏环境具有更大的状态空间,需要更复杂的模型结构与强化学习算法。此外,参赛选手还要考虑奖励函数设计,训练方式探索等内容。