摘要:
提出一种基于模型平均与-散度的稳健半监督方法:一方面,通过引入模型平均方法解决无标签数据质量不高的问题;另一方面,通过引入基于-散度的逻辑回归解决有标签数据存在误标签的问题。该模型的优点在于,它能够利用不同模型的预测差异来处理数据,有效利用无标签数据的信息,同时尽可能减少其中的有害信息;并通过引入-散度减少有标签数据中误标签数据对拟合效果的影响,最终得到对于无标签数据和有标签数据均稳健的模型。模拟研究和Breast Cancer数据应用表明,与现有半监督学习方法相比,当数据质量较低时,所提出的新方法在预测性能上有明显的提升。
中图分类号:
吴慧桢, 张三国. 基于模型平均与γ-散度的稳健半监督学习方法[J]. 中国科学院大学学报, 2026, 43(1): 14-22.
Huizhen WU, Sanguo ZHANG. Robust semi-supervised learning model based on model averaging and -divergence[J]. Journal of University of Chinese Academy of Sciences, 2026, 43(1): 14-22.