欢迎访问中国科学院大学学报,今天是
不确定度增强下基于模型的探索-学习策略联合优化*
肖士湘, 黄文振, 焦建彬
Model-based explorer-learner joint optimization via uncertainty augmentation
XIAO Shixiang, HUANG Wenzhen, JIAO Jianbin
中国科学院大学学报 . .  DOI: 10.7523/j.ucas.2024.072