随着人工智能技术的飞速发展,其在医疗行业的应用正变得日益关键,特别是在医学影像分析这一细分领域。AI技术的应用使得医生能够更加迅速和准确地诊断疾病,并制定出更为精确的治疗方案。然而,AI的智能化水平提升,离不开大量高质量医学影像数据的支持,这些数据是训练AI系统不可或缺的“燃料”。
获取高质量、多样化的医学影像数据面临着诸多挑战,包括患者隐私保护和数据标注成本高昂等问题。为了克服这些障碍,研究人员开始尝试利用生成式AI技术来合成医学影像数据,以此扩充数据资源。
在此背景下,北京大学与温州医科大学的研究团队开发了一种名为生成式多模态跨器官医学影像基础模型(MINIM),该模型能够根据文本指令和多种器官的多种成像方式,生成大量的高质量医学影像数据。这一技术为医学影像大模型的训练、精准医疗及个性化治疗提供了强有力的技术支持。
该研究成果已于12月11日在国际知名期刊《自然・医学》上发表,DOI为10.1038/s41591-024-03359-y。MINIM模型就像一个“医学影像的魔术师”,能够根据AI技术,依据文字描述自动合成海量的医学影像数据,包括CT、X光、磁共振等多种成像方式,覆盖了各个器官。
北京大学未来技术学院的助理研究员王劲卓解释说,“目前公开的医学影像数据非常有限,我们开发的生成式模型有望解决训练数据不足的问题。”
这些合成影像数据的真实性如何呢?研究团队使用多种器官在CT、X光、磁共振等不同成像方式下的高质量影像文本配对数据进行训练,最终生成的医学合成影像在图像特征和细节呈现上与真实医学图像高度相似。
实验结果证实,使用MINIM生成的合成数据,在医生的主观评价和客观检测标准上均达到了国际领先水平。在真实数据的基础上,结合20倍的合成数据,眼科、胸科、脑科和乳腺科等多个医学任务的准确率平均提升了12%至17%。
王劲卓还指出,MINIM生成的合成数据具有广阔的应用前景,既可以单独用于训练医学影像大模型,也可以与真实数据结合使用,以提高模型在实际应用中的性能,并推动AI在医学和健康领域的更广泛应用。
目前,在疾病诊断、医学报告生成和自监督学习等关键领域,利用MINIM合成数据进行训练已经显示出显著的性能提升。