瑞金医院与华为“博士天团”联手攻坚 炼就顶级病理大模型并启动开源

极客网·极客观察(朱飞)7月2日AI与医疗行业加速融合发展的当下,一个令人瞩目的消息震撼了医学界与科技界——上海交通大学医学院附属瑞金医院(以下简称“瑞金医院”)携手华为,从0到1成功打造临床级病理大模型RuiPath,并于6月30日正式宣布开源其核心模型,开启从1到N的规模复制之路。

这一领先成果凝聚了华为算法博士团队与瑞金医院医学博士团队无数的心血,堪称科技界与医疗界跨界融合的典范。此番随着RuiPath走向成熟并启动开源,其不仅以病理诊断为核心突破口加速了AI在医疗领域的落地,也为全国医疗领域带来了AI普惠的曙光。

疾病诊断的“金标准”亟待攻克

病理诊断作为疾病诊断的“金标准”,在医疗体系中占据着举足轻重的地位。然而,当前的医学领域在病理诊断方面面临着诸多棘手难题。

据中国国家癌症中心发布的《2024中国癌症报告》数据显示,2022年中国约新发482.47万癌症病例,其中死亡病例257万例。而早发现、早诊断、早治疗是关键,亟需扩大病理诊断可及性、提升病理诊断准确率及基层病理诊断水平。

然而,数据显示目前中国注册病理医生不足2万人,缺口高达14万,并且约70%的病理医生集中在三甲医院。这导致这些医院的病理诊断工作任务繁重,医生压力巨大,高强度的工作使得误诊、漏诊的风险增加。比如瑞金等大型三甲医院每天等待被检查的切片高达6000张以上,病理医生每天阅片多达200-300张。

不仅如此,很大一部分基层医院的病理医生依旧完全依赖传统显微镜进行病理诊断,不仅效率低下,而且由于技术手段有限,出现漏诊与误诊的概率较高。这使得许多患者不得不跨省求医,耗费大量的时间、精力与金钱。

面对困境,传统的单癌种小模型开发模式愈发显得力不从心。一方面小模型往往数据量有限,难以涵盖多种癌种的复杂特征,对于一些罕见病或复杂病例更是难以准确诊断。另一方面小模型的训练和应用较为孤立,无法形成一个系统的、全面的病理诊断体系,难以满足临床实践中对精准、高效病理诊断的迫切需求。

因此,开发一个强大的、能够覆盖多种癌种、具备高准确性和高效性的病理大模型,去攻克疾病诊断的“金标准”病理诊断,迫在眉睫。

顶级团队跨界合力打造RuiPath

面对重重困难,瑞金医院与华为决定携手跨界合作,以“三年磨一剑”的长期主义,踏上从0到1打造临床级病理大模型RuiPath的艰难征程。

第一阶段的工作重心是病理数字化,即在瑞金医院采用统一数字病理格式(CSP)高效存放数据(空间节省45%),实现病理切片数据的标准化落地。从2023年联合业界发布《数字化智慧病理科建设白皮书》,到2025年共积累了百万规模高质量数字化病理数据,为后续的智慧化打下坚实基础。

第二阶段是病理智慧化,这期间华为天才少年团队入驻瑞金医院,进行数据工程、模型工程、应用工程的联合研发。双方基于高质量数据,通过“医生+AI工程师”进行模型蒸馏、知识蒸馏、模型精调,改变了传统单癌种小模型开发模式,实现大模型从泛癌种精准识别、辅助诊断任务到上层应用的端到端落地,贯穿医生诊断全流程。

值得一提的是,在合作过程中双方组建了顶级的跨界“博士天团”——瑞金医院40余名临床医学博士、主任级专家组成病理科专家团队,与华为由来自CMU、北大等顶尖院校的算法博士组成的AI技术团队,医工融合双向奔赴,方才解决了模型落地过程中的数据准备难、模型开发难、算力投入大、应用对接难四大难关,完成了RuiPath基于临床实际场景的方案设计和联合开发。

这其中,每一个难关的突破都十分不易。以容易被忽略的数据准备为例,中国医疗行业病理数字化水平参差不齐,仍有约30%的二、三级医院仍需依赖传统显微镜进行病理诊断,病理切片图像数据累积不足;即使在病理数字化水平较高的三甲医院,也面临图像数据量大、格式不统一、数据标注耗时长的问题,数据预处理耗时占模型开发训练时长的比例高达60%。

这方面双方基于华为DCS AI解决方案着重攻坚,基于统一数字病理格式(CSP)格式将繁杂的病理切片图像格式统一,为模型训练做好数据准备;并通过ModelEngine提供专业数据处理工具,让医生不再是“标注工”,而是“审核官”,从逐条标注变为批量审核,实现效率提升数倍,并保证标注的专业性和准确性。

最终,双方通力合作打造出临床级多模态病理大模型RuiPath,其涵盖泛癌种视觉特征提取、视觉-语言跨层表征对齐、长序列的深度思考模型训练机制等能力,用于全流程临床病理辅助诊断,目前已覆盖中国每年全癌种发病人数90%的19个常见癌种,涵盖上百个辅助诊断任务,并可实现AI互动式阅片,将单切片诊断时间从传统镜下的5-10分钟提升至秒级。

开源创新推动医疗AI普惠发展

更进一步,作为此次发布的重头戏,瑞金医院联合华为正式开源RuiPath病理模型的核心“视觉基础模型”, 开启了RuiPath从1到N的规模复制之路。

该模型在业界12个主流公开数据集的14个辅助诊断任务测试中,有7个达到业界领先水平(SOTA),已具备临床验证能力。同时本次开源配套提供测试数据集,覆盖了肺癌、结直肠癌、甲状腺癌、胃癌、乳腺癌、前列腺癌、胰腺癌7个常见癌种。此外华为还同步开放工具及实践指南,全面使能其他医院使用基础模型或开展微调训练。

在开源开放成为创新主旋律的当下,RuiPath这一动作意义重大而深远。

从基层医院的角度来看,以往基层医院布局病理AI需要从最基础的工作开始,耗费大量的人力、物力和时间。现在它们只需结合自身的数据对开源模型进行精调,就能够快速应用病理AI辅助诊断技术,大大节省了数据准备、模型训练、应用开发的大量初始工作,有效降低了医疗AI落地门槛。

对医疗行业整体发展而言,开放数据标准、工具、评测数据集,解决了源头数据处理、模型部署、应用开发、评测上线的一系列实际困难,打通从模型到应用的“最后一公里”,为AI行业化落地提供了最佳实践,有利于加速AI在医疗行业落地。

同时,瑞金医院将积累百年的疾病诊断经验沉淀于RuiPath模型并向行业开源,实现了头部三甲医院病理诊断能力向行业的快速复制。这有助于拉齐中国各大医院在病理诊断方面的水准,让不同地区的患者都能享受到高质量的病理诊断服务,真正推动“医疗平权”。

当然,随着开源发展模式的运转,更多同道参与到病理辅助诊断模型的研究与应用中,也能加速RuiPath病理模型临床应用落地,共同提高AI医疗水平。

就在发布会期间,瑞金医院又与来自海内外的12家医疗机构共同启动RuiPath病理大模型的全球多中心计划,共享最新研发成果,协同推动病理大模型持续迭代。可预见,随着更多医院的参与,必将加速RuiPath病理模型临床应用的落地进程,让AI医疗能力持续惠及全社会。

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2025-07-02
瑞金医院与华为“博士天团”联手攻坚 炼就顶级病理大模型并启动开源
​百万级病理切片训练

长按扫码 阅读全文