欢迎访问中国科学院大学学报,今天是
基于不确定度的多智能体信用分配方法
杨光开, 陈皓, 张茗奕, 尹奇跃, 黄凯奇
Uncertainty-based credit assignment for cooperative multi-agent reinforcement learning
YANG Guangkai, CHEN Hao, ZHANG Mingyi, YIN Qiyue, HUANG Kaiqi
中国科学院大学学报 . 2024, (2): 231 -240 .  DOI: 10.7523/j.ucas.2022.047