基于不确定度的多智能体信用分配方法
杨光开, 陈皓, 张茗奕, 尹奇跃, 黄凯奇
Uncertainty-based credit assignment for cooperative multi-agent reinforcement learning
YANG Guangkai, CHEN Hao, ZHANG Mingyi, YIN Qiyue, HUANG Kaiqi
中国科学院大学学报
.
2024, (2): 231
-240
.
DOI: 10.7523/j.ucas.2022.047