来源:HIT专家网 作者:朱小兵
6月30日,上海交通大学附属瑞金医院(以下简称瑞金医院)联合华为技术有限公司(以下简称华为)举行发布会,宣布将双方联合研制的瑞金病理模型RuiPath开源。
瑞金医院从2021年开始积极推进数字化智慧病理科建设。2023年,瑞金医院开始与华为合作,联合业界发布中国首本《数字化智慧病理科建设白皮书》,并于2025年2月发布RuiPath病理模型。RuiPath突破传统小模型局限,覆盖19个常见癌种,涵盖100多种辅助诊断任务,可覆盖中国每年90%的癌症发病人群。数月来,RuiPath性能进一步提升,不断贴近临床诊断需求。
“医学AI发展到今天,为什么一直在发布,临床总是不应用?”就在这场发布会上,瑞金医院院长宁光院士在致辞时开门见山地发问。他指出,从“发布”走到真正的“临床应用”,是医学AI亟需跨出的一大步。这就是为什么此次成果发布会的关键词是“开源”。
此次开源的“技术含金量”究竟几何?
据悉,本次开源范围包括:视觉基础模型RuiPath-VisionFoundation-V1.0,以及涵盖7个癌种(肺癌、结直肠癌、甲状腺癌、胃癌、乳腺癌、前列腺癌、胰腺癌)共计21个辅助诊断任务的高质量WSI评测数据集。同时,华为配套开放了基于ModelEngine面向计算病理学辅助诊断任务的数据工程、模型工程以及病理应用编排工具,帮助医疗机构快速开展计算病理学研究和应用。
上述开源内容所蕴含的“技术含金量”究竟几何?最具代表性的莫过于视觉基础模型——RuiPath病理模型的核心。
上海市数字医学创新中心专职副主任朱立峰介绍,视觉基础模型主要解决病理图像的特征提取问题,即将高维图像信息压缩为一组具有分类能力的特征向量,旨在降维的同时尽可能保留原病理图像中的关键信息。哈佛医学院团队2024年在《Nature Medicine》上发表的UNI模型和2025年发布的UNI2模型就是此类模型的代表。
从病理模型的发展脉络看,以病理图像为主的单模态视觉模型,正在向融合病理图像与病理报告的“视觉-语言模型”发展,甚至开始探索病理图像加转录组学、基因组学等多模态融合模型,及病理图像、病理报告加放射、超声等文本报告的融合模型。因此,视觉基础模型是病理模型发展的核心。
RuiPath此次开源的视觉基础模型,基于ViT(Vision Transformer)模型结构和DINOv2自监督学习框架,在瑞金医院百万规模病理WSI图像数据基础上,进行自监督学习预训练而来。而百万规模的WSI图像数据,已达到当前国际主流病理基础模型训练的水平。
RuiPath在视觉基础模型之上,构建了支持上百个辅助诊断任务的模型,并基于视觉语言跨层级特征对齐技术训练病理多模态大模型,支持对WSI图像ROI区域截图生成镜下所见的描述文本和病理学多轮知识问答。RuiPath视觉基础模型在业界12个主流公开数据集的14个辅助诊断任务测试中,有7个达到业界领先水平,已具备临床验证能力。模型能力随病理诊断增加持续增强,准确率持续提升。
不仅如此,难能可贵的是,瑞金医院病理科主任王朝夫团队把经过资深病理医生层层把关筛选出的700张高质量病理切片数据等成果一并开源,其他研究单位可以利用这一宝贵的数据资源来优化、检验他们的智慧病理方案,使计算病理学的研究变得更加高效。
华为ModelEngine内置50多个数据处理算子和影像标注工具,可以帮助完成数字病理切片的轮廓提取、特征提取等工序;提供CSP格式(高压缩、低时延)转换,解决多源设备兼容性问题,百万切片预处理时间从月级缩短至天级。基于ModelEngine AI全流程工具链,医疗机构可以自己完成数据准备、模型训推、应用编排等任务,最终让每个医疗机构都能拥有一套“量身定制”的AI病理辅助诊断系统,降低病理大模型的临床应用门槛。
为何垂域模型也要开源?
自2025年初DeepSeek爆火以来,国内多个大模型纷纷跟进,选择开源。通用大模型在医疗行业大量场景的应用探索,方兴未艾。
瑞金RuiPath则应该是国内首个由医疗机构主导的临床大模型开源。为什么要将这一垂域模型也进行开源?宁光院士列出两点主因:
第一,推动临床真正的应用。RuiPath虽然目前已经覆盖了较多疾病种类,但毕竟还有部分肿瘤尚未覆盖,比如口腔、小儿专科领域等。只有做到全覆盖,才可能达到临床应用级的垂域模型。选择开源,就是期望业界一起来提高。
第二,实现医学AI的普惠。病理诊断是典型基层和头部医院之间技术水平差距很大的科室,病理大模型的研发门槛又很高。只有开源,才能让创新成果惠及更多医院,特别是基层医院。
“借助RuiPath,瑞金医院病理科实现了从slide by slide的传统阅片模式向更为高效的step by step的人机交互的辅助诊断模式的转变,并且具备了临床实战能力。”瑞金医院病理科副主任医师笪倩描述了这样的工作场景:通过病理管理信息系统(PIS)直接跳转到RuiPath辅助诊断页面,左侧呈现的是一系列临床诊断任务,右侧则是高清显示的数字病理切片。此时,根据不同切片对应的诊断任务,RuiPath自动输出AI辅助诊断结果,医生做出采纳与否的决策,予以结果反馈。在此基础上,RuiPath辅助诊断系统最终可以生成一份病理报告,发回PIS系统,经过医生审核以后,这份病理报告就可以发出。
虽然全国已有大约5000家医院设有病理科,但其中仅有不到5%的医院应用了数字化辅助诊断系统,病理科的数智化转型潜力巨大。仅病理数据本身而言,绝大多数病理科都面临多重障碍:病理切片和扫描的质量不合格,会影响模型的精度;数据的格式不统一就会形成数据孤岛;高质量病理数据的规模十分有限。
医院还普遍面临算力成本与系统集成的双重挑战:业界病理大模型动辄需要使用上百张英伟达A100 GPU卡,训推成本极高,无法实现普及。AI集群因任务潮汐、资源碎片化,可用度不足50%,造成算力浪费。另外,AI病理精准诊断需整合病理图像、病史、基因组学数据,但医院内部系统数据孤岛林立,模型难以实时调取多源数据。为此,华为采用一系列工程化的方法进行突破,通过存算协同架构,仅用16张算力卡,耗时两个月,就完成百万切片训练,成本降低90%。同时采用SmartAI智能调度引擎进行训推任务的动态分配,实现昼推夜训,避免算力闲置。此外,还利用vNPU切分池化技术实现AI算力利用率提升30%。
营造医学AI新生态,RuiPath开源开了一个好头
关于开源,瑞金医院和华为有如下共同愿景:
一是降低病理AI辅助诊断部署门槛:医疗机构可获得基础模型和工具,节省数据准备(如图文配对、WSI切分)、模型训练、应用开发的大量初始工作,促进病理AI辅助诊断广泛应用,繁荣生态。
二是加速AI在病理领域落地:希望通过开源模型和评测数据集,开放工具链,打通从模型到应用的全流程,为病理AI落地给出示范实践。
三是助力提升全国病理辅助诊断水平:将瑞金医院乃至更多医院的优质病理数据、经验和知识沉淀到RuiPath病理模型,帮助提升全国各级医院病理辅助诊断能力。
要获得本次开源的视觉基础模型和评测数据集,可以在国内主流的大模型社区魔搭、魔乐进行申请。此次支持RuiPath病理模型研发和开源的是华为DCS AI解决方案,其核心组件——ModelEngine AI全流程工具链目前也是开源状态,可以在魔擎社区进行申请。申请者提供实名信息和用途说明,审批后即可开通。
接下来,各医疗机构可以基于瑞金医院开源的病理模型,结合自身的数据进行模型精调、优化。华为从病理模型开发阶段就考虑到医疗行业应用推广的成本问题,通过模型工程蒸馏、优化、以查代算、XPU池化等技术,在提升能效的同时大幅降低落地成本,完成数据、模型、应用、评测的工具化、标准化等工作,打通了从模型到应用“最后一公里”的难点。考虑到很多医院病理数字化准备不足,华为一方面开源瑞金病理模型训练中用到的数据标注等工具,另一方面通过数字病理格式(CSP)帮助医院统一病理切片图像格式,为模型训练做好数据准备。
朱立峰副主任说:“我们欢迎大家申请下载此次开源的模型、数据集和工具链,用于自身研究。希望能吸引更多的同道,加入到RuiPath的研发中。不同医院在疾病谱系上各有特色,只有共享融合才能进一步提升病理大模型的病种覆盖范围。同时,不同医院在病理切片染色、制片、扫描时也存在差异,希望不同医院的加入,能提升病理大模型的泛化能力。”
在6月30日的发布会上,瑞金医院还与来自海内外的12家医疗机构宣布,共同启动RuiPath病理大模型的全球多中心计划,共享最新研发成果,协同推动病理大模型持续迭代。
开源的本质是通过开放共享激发集体创造智慧。瑞金病理模型开源,对于营造开放、协作的医学AI新生态,无疑开了一个好头。
正如宁光院士所期望:“虽然瑞金可能前行了一小步,但是真正要跨出一大步,实现临床可用的病理大模型,还要汇聚同道的智慧。”他相信不久的将来,上海不仅会产生瑞金病理科的RuiPath,也会有更多医院产出垂域大模型成果,形成垂域大模型生态。“到那时,我们将不再是一家一家医院在发布医学AI,而是一家一家医院在使用,全上海都在使用。只有这样,才能促进各种垂域医学大模型在上海的使用、在中国的使用,乃至于在全球的使用。”宁光院士说。

精彩不容错过!
【责任编辑:陈曦 版式:明超】
评论前必须登录!
注册