标签分布学习(Label Distribution learning,简称LDL)是一种处理标签模糊性的新的学习模式。与传统的监督学习场景相比,使用标签分布进行注释更为昂贵。直接使用现有的主动学习(Active Learning,简称AL)方法,可以降低传统学习中的注释成本,但可能会导致性能下降。
为了解决这些问题,由Tingjin Luo领导的研究团队在《计算机科学前沿》杂志上发表了新的研究成果。
该团队提出了一种新的主动标签分布学习方法,即通过核最大均值差异(Kernel Maximum Mean Discrepancy,简称kMMD)实现的ALDL-kMMD方法。与传统的AL方法相比,该方法通过对真实世界数据集进行广泛实验验证了其有效性,且优于其他方法。
ALDL-kMMD同时捕获数据和标签的结构信息,通过融合非线性模型和边际概率分布匹配,从未标记示例中提取最具代表性的实例。此外,它还显著减少了查询的未标记实例数量,并通过构建辅助变量提出了ALDL-kMMD原始优化问题的有效解决方案。该算法已经通过在真实数据集上的实验证明了其有效性。
未来的工作重点是将提出的主动学习方法应用到深度学习结构中,并设计一种新的深度主动学习方法来降低对标签信息的依赖性。