安光所提出支持统一3D医学图像分割的半监督 AI 学习框架
时间:2026-04-23 作者:黄义庚
近日,中国科学院安光所桂华侨团队的王焕钦研究员联合安徽医科大学第一附属医院、合肥市第一人民医院等单位,开发了一个通用半监督AI学习框架。该框架支持半监督学习(SSL)、无监督域自适应(UDA)和半监督域泛化(Semi-DG)三项任务,能够显著减轻3D医学图像分割场景下的标注负担以及提升模型多中心泛化性能。相关成果以《基于频率捷径视角的通用半监督3D医学图像分割研究》为题发表在计算机科学领域一区TOP期刊Pattern Recognition(《模式识别》)上。
在3D医学图像分割的工作中,人工标注图片工作量大、流程繁琐,还必须依靠专业人员操作。而半监督学习技术,既能用好已标注精准数据,又能借助大量低成本的未标注图像,有效推动了三维医学图像分割技术的发展。目前大多数半监督学习方法,都默认标注数据与未标注数据来源一致、特征相近。但在真实医疗场景里,医学研究大多为多中心协作模式,影像数据来自不同设备,采集参数也各不相同,这就造成了数据差异偏移问题。这也让相关研究面临更大挑战,衍生出无监督域自适应、半监督域泛化等难题。因此,搭建一套能够适配多种任务的通用算法框架,是破解医学影像标注短缺、数据域偏移两大难题的关键。开发支持SSL、UDA和Semi-DG的通用框架,对于解决3D医学图像分割中标注稀缺和域偏移的双重挑战至关重要。此外,近期研究发现:人工智能神经网络,常会优先学习简单的频率特征来完成识别判断,这一现象被称作频率捷径。这种有偏见的学习方式虽然能简化模型训练,却会大幅降低模型的通用适配能力。而半监督学习中常用的虚拟标注结果本身存在偏差,还会进一步加重频率捷径带来的负面影响。
针对以上痛点,安光所王焕钦研究员团队创新提出抑制频率捷径的新思路,依托对抗训练架构,设计两种全新的数据增强模块,从数据层面限制模型的有偏见学习问题,全面提升模型的泛化与适配能力。一是低频对抗自适应增强模块(L-AAE),避免模型过度依赖单一主流频率特征,同时通过双向对抗调整与风格优化,缩小不同来源医学影像的数据差异。二是进一步提出了频率自适应抑制增强模块(F-ASE),动态调节图像不同频率的特征权重,引导模型全面学习各类频率信息,减少对特定特征的过度依赖。最后,将原始影像与优化后的对抗样本结合,融入半监督学习体系开展训练。团队在相关SSL、UDA和Semi-DG等多项公开标准数据集上完成大量对比实验,充分验证了该方法的先进性与实用性。
该研究为半监督模式下的医学图像分割,提供了新的选择。通过克制频率捷径问题,训练出稳定性更强、分割精度更高的AI模型。本次实验仅采用基础通用网络V-Net作为对照,就实现了优异效果;且所提出的L-AAE和F-ASE两大模块的功能独立于模型架构,不局限于特定网络结构,兼容性强、适用范围广,可快速迁移应用到各类主流算法模型中。除此之外,这套削弱频率捷径的优化思路,同样适用于弱监督、数据差异明显等复杂场景,能够普遍提升AI模型的稳定性,后续还有望推广应用到医学图像分割以外的更多研究领域。
博士生黄义庚为论文的第一作者,通讯作者为王焕钦研究员,本研究得到了国家重点研发计划和安徽省转化医学研究项目的支持。
论文链接:
https://www.sciencedirect.com/science/article/pii/S0031320326007260?via%3Dihub

本论文提出的通用半监督学习框架示意图