9月18日消息(九九)“AI应用层出不穷,算力技术飞速提升,存储技术和产品发展相对缓慢,成为AI大模型训练过程中的性能瓶颈。”在日前举行的2024开放数据中心大会(ODCC)上,江波龙企业级存储事业部高级市场总监曹浔峰在接受C114专访时如是说。
从ChatGPT火遍全球到Sora横空出世,AI的进化与普及日新月异。曹浔峰指出,在此过程中,大模型参数呈指数级增长,据市场机构分析,两年增加410倍,“GPU算力8年增长1000倍”,与之形成鲜明对比的是,GPU内存仅以每2年2倍的速度扩展。缓存的容量和性能跟不上AI算力的提升。
作为在存储市场深耕25年的“老兵”,江波龙如何迎战算力产业发展的新趋势?曹浔峰在访谈中分享了对于AI应用数据存储优化的思考,大模型AI应用下江波龙的企业级产品矩阵,并深度解读了江波龙新近提出的PTM(存储产品技术制造)模式:集芯片设计、固件开发、技术定制、封装测试、生产制造于一体,实现从标准化产品到存储产品一站式服务的升级跨越,打造价值合作新范式。
创新存储技术与产品,迎战万卡AI训练集群
江波龙拥有嵌入式存储、固态硬盘(SSD)、移动存储及内存条四大产品线。产品广泛应用于主流消费类智能终端(如智能手机、可穿戴设备、电脑等)、数据中心、汽车电子、物联网、安防监控、工业控制等领域,以及个人消费类存储零售市场。随着AI的爆发,江波龙基于自身产业能力与时俱进,创新存储技术与产品满足多样化的市场要求。
在AI应用实践中,原始数据需经过精细的清洗和预处理,转化为高质量的数据集,进而通过网络传输至AI服务器的本地SSD存储,并最终upload至GPU HBM缓存中进行训练。曹浔峰指出,随着AI训练模型参数量的增长,现有HBM缓存和系统内存RDIMM容量已难以满足需求。“采用高性能、大容量的CXL存储器或8x GPU卡AI服务器,将是理想的缓存优化解决方案。”
大模型需要大算力,大算力需要大集群。据悉,江波龙正积极探索支持AIC和E3.S的JBOM系统,并结合即将到来的支持CXL2.0服务器系统,为万卡AI训练集群提供更具成本效益的内存池化共享硬件解决方案。
曹浔峰介绍,江波龙基于CXL协议研发了两款存储方案:E3.S形态CXL2.0内存拓展模块最大支持192GB容量,能够适配参数量在万亿级别以下的大模型,相比业界同期水平实现成本大幅下降的优势;针对10万亿参数规模的大模型,江波龙升级研发了AIC形态、最大支持512GB内存的拓展模块,目前正在与一些国家级实验室做联合测试,面市后将进一步推动AI应用的存储优化。
打造企业级产品矩阵,攻关产品可靠性和稳定性
数据中心是存储产品的重要应用领域,特别是随着算力的极速发展,数据中心成为更具潜力的存储市场。曹浔峰介绍,江波龙从2020年开始投入用于数据中心企业级存储产品的研发,截至目前已成功构建了完整的企业级存储布局,推出包括企业级PCIe 4.0 NVMe SSD、企业级SATA SSD、企业级RDIMM、CXL 2.0内存拓展模块在内的多款高性能产品。
曹浔峰指出,对于AI服务器,企业级SSD的高性能和大容量特性,能够有效支持复杂的机器学习模型训练、数据分析和内容生成等AI应用,加速AI计算过程,提高整体的系统效率和智能分析能力。同时,随着AI服务器计算密度的显著提升,单机的功耗密度也相应增加,不仅对服务器的能源管理提出了更高要求,也加速了SSD取代传统机械硬盘(HDD)的进程,以实现更优的能效比。
曹浔峰进一步指出,AI训练应用主要涉及顺序读写操作,QLC SSD在顺序读写性能上与TLC相近,且成本更具优势。随着PCIe Gen5带宽的提升,QLC技术完全能够满足AI训练过程中Checkpoint数据存储的高带宽高并发需求,预示着QLC SSD有望成为大语言模型AI训练应用的更优选择。曹浔峰介绍,江波龙未来有望推出更具有性价比的QLC SSD产品。
曹浔峰强调:“对于企业级产品而言,性能并不是唯一的指标,更为关键的是产品的可靠性和稳定性。”江波龙对此投入巨大,通过颗粒研究和测试算法等手段将产品的抖动降至最低,可靠性和稳定性具有较大的竞争优势。”
从标准化到定制化,PTM模式为客户提供全栈式服务和一站式交付
访谈中,曹浔峰重点介绍了江波龙新近提出的PTM(存储产品技术制造)模式,该模式的核心在于将公司的自研存储控制芯片、自研固件和硬件以及自有的先进封测制造等技术优势进行无缝衔接,实现更灵活、高效的全栈式定制化服务和一站式交付。
不难看出,PTM模式的两个关键词分别是“全栈式定制”和“一站式交付”。与这种创新的商业模式相匹配的是江波龙布局多年的自主研发与智能制造能力,以及随之构建的高端存储全栈能力。“存储全栈式定制服务就像高级西装的量身定制,每一细节都经过一对一精心打造,确保每款产品方案‘裁剪’出来都能贴合、匹配客户的独特需求。”曹浔峰说。
在技术领域,江波龙拥有自主研发NAND Flash芯片、主控芯片、固件和硬件的能力,并采用多颗粒类型产品布局,能够根据客户的特定技术需求提供定制化的存储解决方案。此外,江波龙汇聚了众多行业资深专家,积累了丰富的技术经验,特别是在颗粒研究、测试算法和设备开发等方面,能够深入分析NAND Flash和DRAM的特性,并与客户预先确认技术需求。通过建立专业、专项的FAE+AE+R&D团队,PTM商业模式能够帮助企业级客户高效实现产品创新和大幅成本优化,从而提升客户的业务竞争力。
在制造方面,江波龙通过在中山存储产业园、苏州和南美洲封装测试基地的国内、海外双循环产业链布局,实现了从存储芯片到模组产品的全链条覆盖。不仅保证了业内领先的企业级生产产能,还实现了高效的全站点追溯能力,如同餐厅的开放式厨房,确保每道工序都可视化、透明化,让客户对产品品质和生产流程拥有更为清晰而直观的了解。
通过上述综合措施,PTM商业模式已经实现了从技术到制造再到产品的全方位支持,成功为华勤等客户提供定制化的一站式交付产品,产品性价比得到客户高度评价。
对于存储产品未来的发展方向,曹浔峰认为是存储池化,以适应AI大模型应用发展的缓存需求。曹浔峰表示,江波龙将聚焦于开发性能更好、容量更大、成本更低存储产品,并引入QLC NAND Flash作为资源补充,以满足不同客户的差异化需求,与产业链合作伙伴共同推动算力产业进步。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。