(源初/文)2023年,全球芯片行业继续保持增长态势,根据国际半导体产业协会预测,2023年全球半导体销售额将达到6860亿美元,同比增长10.1%,5G、云计算、人工智能等新兴应用的快速发展,推动了芯片需求的增长。
而要说2023年芯片领域什么最热,故事还要从年初的ChatGPT开始,黄仁勋当时表示:“我们正处于AI的‘ iPhone 时刻’。”成就生成式AI的背后,自然是AI算力的支持。
“iPhone时刻”引爆芯片需求
2023年3月,英伟达宣布推出全新的H100 NVL计算加速卡,专为大型语言模型训练(LLM)设计,性能更强。其搭载了两个基于Hopper架构的H100芯片,顶部配备了三个NVLink连接器,在服务器里使用了两个相邻的PCIe全长插槽。H100 NVL计算卡的FP64计算性能为134TFLOPS,TF32计算性能为1979 TFLOPS,FP8计算性能为7916 TFLOPS,INT8计算性能为7916 TFLOPS,是H100 SXM的两倍。其具有完整的6144位显存接口,显存速率可达5.1Gbps,意味着最大吞吐量为7.8TB/s,是H100 SM3的两倍多。
年底,英特尔CEO 基辛格首次公开介绍第三代英特尔AI加速器Gaudi 3,它用于深度学习和大型生成式AI模型。英特尔计划明年发布Gaudi 3,称Gaudi 3的性能将优于英伟达的主打AI芯片H100。据悉,Gaudi 3将于2024年推出,采用5nm制程,相较前代提供到达4倍的BFloat16 功能、2 倍的运算能力、1.5倍的网络频宽和1.5倍的HBM容量。
AMD也在年底正式发布两款AI芯片旗舰产品,Instinct MI300X与MI300A。MI300X专为生成式AI智能算力设计的数据中心GPU,正面对标英伟达H100;MI300A则是专为超级计算机设计的APU产品。APU为AMD在2011年提出的升级版CPU概念,其将CPU和GPU组合在同一个晶片上,以满足超级计算机高性能计算的要求。
端侧AI卷起来
端侧AI的概念也开始兴起。今年5月,高通在线上发布了《混合AI是AI的未来》白皮书,梳理了高通在AI领域技术发展和应用趋势方面的洞察,旨在与更多合作伙伴共同探索AI技术普惠之路。通过终端侧AI算力与云端的结合,恰恰能够解决目前生成式AI完全依靠云端而出现的各种隐忧。例如在功耗方面,如果在云端运行一个超过10亿参数的生成式AI模型,可能需要数百瓦功耗的话,但在终端侧运行需要的功耗仅有几毫瓦。
高通在今年巴展期间所带来的Stable Diffusion在Android终端上的演示为例,能够在15秒内完成20步推理,生成包含细节的图像,整个过程全部在本地化进行,即使手机设置成飞行模式,也能完成根据文字描述所进行的绘画创作任务。这种特性既为用户带来了更加灵活高效的使用方式,又大大提升了隐私保护性。
骁龙峰会期间发布的第三代骁龙8移动平台,NPU提升高达98%,能效提升40%。在AI表现上可实现本地运行100亿参数的模型,面向70亿参数大语言模型每秒生成高达20个token,实际应用中可在本地实现一秒内完成Stable Diffusion的图片生成。同期发布的面向移动PC领域的骁龙X Elite,CPU+GPU+NPU结合而成的AI算力更是高达75TOPS,其中NPU算力高达45TOPS,AI处理速度是竞品的4.5倍。
年底,英特尔在以“AI Everywhere”为主题的活动中发布酷睿Ultra移动处理器,英特尔为新CPU配备NPU提供“低功耗人工智能加速和CPU/GPU卸载”,专为在低功耗下长时间运行的AI工作负载而设计,与CPU 和GPU的AI功能相辅相成,与前代相比,能够带来2.5倍的能效表现,能够执行人工智能驱动的任务,如背景模糊、眼动追踪和图片框架等。
联发科的9300同样搭载了基于硬件的生成式 AI 引擎,生成式 AI transformer 运算速度快 8 倍,2 倍整数和浮点运算速度,功耗较前一代降低 45%,最高可支持 330 亿参数的 AI 大语言模型,支持 NeuroPilot Compression 内存硬件压缩技术,生成式 AI 端侧技能扩充技术。
3nm终于来了
相比于去年A16处理器的小修小补,苹果伴随iPhone 15 Pro系列推出的A17 Pro终于迎来台积电3nm制程,拥有高达170亿个晶体管,也成为了业界首款搭载3nm制程芯片的系列手机。A17 Pro芯片硬件加速光线追踪的运行速度提升最高可达4倍,神经网络引擎运行机器学习模型的速度提升最快可达2倍,每秒可执行最高达35万亿次操作。
根据台积电给出的数据显示,3nm制程的逻辑密度将增加约70%,相同功耗下,速度提升10~15%,或于相同速度下,功耗降低25~30%。不过,台积电3nm制程对于iPhone所带来的使用体验提升并不明显。考虑到机身设计问题,也为iPhone 15 Pro系列带来了散热问题。
10月底,苹果再次伴随新款Macbook Pro系列发布采用3nm制程的M3系列芯片。苹果表示M3在CPU性能上比M1快了35%。M3还配备了采用下一代架构的10核GPU,图形性能比M1快65%。M3还支持高达 24G B 的统一内存和一台外接显示器。M3 Pro在单线程任务中,CPU性能比M1 Pro快30%。M3 Pro最高支持36GB统一内存。M3 Max拥有920亿个晶体管和16核GPU,包括12个性能核心和4个效率核心,以及40核GPU,比M1 Max快50%。M3 Max最高支持128GB统一内存。M3 Max的GPU性能比M1 Max快80%。
展望2024年,全球芯片行业仍将保持增长态势。 云计算、人工智能等新兴应用的快速发展,将继续推动高性能芯片的需求。预计在2024年,云计算、人工智能芯片的市场规模将达到3000亿美元,同比增长15%。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。