16张卡2个月训练百万病理切片,华为DCS AI解决方案如何做到?

极客网·人工智能 近期,DeepSeek的火爆引发了AI产业对低成本、高效率大模型训练的广泛讨论。今日,医疗AI领域新发布的瑞金医院瑞智病理大模型RuiPath也凭借其高效训练和落地应用,成为行业关注的焦点。

image001.png

RuiPath由华为DCS AI解决方案助力打造,仅用16张计算卡、历时2个月,便完成了超100万张病理切片的训练,实现了医疗行业专家大模型的成功落地。这一成就不仅展示了“花小钱办大事”的可能性,更为行业大模型的高效训练提供了范例。

三大挑战阻碍AI大模型行业化落地

与互联网领域的通用大模型不同,行业用户更关注如何将通用大模型转化为专业大模型,以释放其真正的价值。然而,这一过程面临三大挑战。

23456.jpg

首先,在数据层面,从通用大模型到行业场景大模型,针对性训练所需的数据预处理耗时长,收集、清洗等环节往往占据模型开发训练时长的60%。例如,瑞金医院拥有海量的图像、文本等多模态数据,覆盖临床、影像、病理等多个领域,这些数据在训练前需要进行完备的标签化处理,才能开展精准的模型训练。

其次,在算法层面,行业场景模型的训练和应用落地难度大,开发周期不可控,且对人员技术要求高。非互联网科技行业的企业通常缺乏足够的AI技术人才,需要简单易用的开发平台来降低门槛,使行业人员也能轻松上手。

最后,在算力层面,由于算力等待、任务潮汐、资源碎片化等原因,AI集群的可用度通常不足50%。多数行业无法大量采购计算卡来实现大模型的落地,因此必须从一开始就考虑训练和推理任务的降本增效。

华为DCS AI解决方案的三大核心价值

针对这些挑战,华为DCS AI解决方案通过ModelEngine工具链、XPU池化和容器技术以及融合数据湖等关键能力,成功解决了数据工程处理慢、模型/应用对接难、AI系统可用度低的三大问题,并在医疗病理场景中展现出显著优势。

12345.jpg

首先,数据工程工具化将医疗训练数据准备周期缩短了80%。方案将病理数据统一为高压缩、低时延的CSP格式,实现数据标准化,并通过Omni-Dataverse技术实现跨院区数据的统一管理。ModelEngine内置40多种数据处理算子,其中独有的CSP免patch切分算子,将百万级切片预处理时间从月级缩短到天级。

其次,系统级模型训练与推理加速能力将模型训练周期缩短了30%,推理并发能力提升了一倍。高性能分布式文件存储系统支持NDS存算协同和KVCache智能分级缓存,减少重复计算,提升数据加载效率。SmartAI智能调度引擎结合XPU池化技术,有效提升了AI集群的可用度。

最后,极简应用开发平台支持低代码开发、可视调测、自动评估、一键部署和零代码维护,将应用上线周期缩短了80%。此外,华为还开源了ModelEngine版本,帮助集成商搭建个性化的AI应用开发平台。

行业大模型落地的“DeepSeek范式”

最终,在华为DCS AI解决方案的助力下,RuiPath仅用2个月便完成了300余本病理诊断书籍和100万张数字切片的训练,显著提升了医疗行业专家模型的训练、推理及精调效率,同时有效降低了部署成本。

微信图片_20250220141018.jpg

据瑞金医院病理医生介绍,RuiPath在病理诊断常用问题测试中准确率超过90%,在医学图文问答任务中处于国际领先水平。AI互动式阅片将单切片诊断时间从5-10分钟缩短至秒级,医生的工作模式也从镜下找病灶转变为审核AI诊断结果,显著提升了诊断效率。

从中可见,行业大模型落地也迎来了自己的“DeepSeek范式”。华为DCS AI解决方案不仅助力瑞金医院RuiPath在医疗行业打造成功实践,更为其他行业的AI大模型落地提供了低成本、高效率的选择,有望推动了AI大模型在更多领域落地生根!


(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2025-02-20
16张卡2个月训练百万病理切片,华为DCS AI解决方案如何做到?
行业大模型落地迎来自己的“DeepSeek范式”

长按扫码 阅读全文