西安交通大学兰旭光老师课题组张翰博同学论文被IJCAI-21收录 - 首页
西安交通大学兰旭光老师课题组张翰博同学论文被IJCAI-21收录
稀疏奖励问题是强化学习领域中的一项重大挑战,兰旭光老师课题组张翰博同学提出了一个新的强化学习算法——HTRPO,通过hindsight对TRPO算法进行扩展,一应对稀疏奖励的挑战。论文被2021年第三十届国际人工智能联合会议(IJCAI-21,the 30th International Joint Conference on Artificial Intelligence )收录
新
News List
闻列表
-
2024
07-09
-
2023
12-04
-
2023
10-04
-
2023
08-10
-
2023
07-20
-
2023
06-01