近日,亚马逊云科技re:Invent2024中国行巡展来到了第二站——上海。在上海站的巡展活动上亚马逊云科技带来了在美国举办的 re:Invent全球大会上推出的一系列技术发布,以覆盖基础设施、模型和应用的全栈联动创新助力企业应用生成式AI,全面重塑客户云上创新体验。
需求侧推动:创新发展的核心动力
市场的需求是创新发展的根本动力。客户的需求和偏好不断变化,推动着企业不断创新以满足其需求。自2006年推出首款产品以来,亚马逊云科技始终秉承逆向工作法,即根据客户需求进行针对性开发,避免闭门造车。
亚马逊云科技大中华区解决方案架构总经理代闻强调:“只有客户有需求了,我们才会去进行相应开发。”这种理念促使公司深入剖析客户问题背后的根本原因,从而推动创新。例如,客户可能只表达了对更快、更便宜GPU的需求,而公司则能洞察到他们实际需要的是定制芯片,并通过创新手段解决这类隐藏需求。
为了满足不同用户的多样化需求,亚马逊云科技从底层硬件到平台软件,再到新发布的大模型及开箱即用的服务等各个层面,都进行了全面布局。代闻指出,亚马逊云科技的创新并非简单的版本迭代,而是呈现出矩阵式、全栈式的创新形态。这种创新不仅体现在单个产品的升级上,更体现在整个产品体系的协同演进上。
亚马逊云科技大中华区解决方案架构总经理代闻
技术侧创新:全栈联动释放价值
自研芯片引领算力革命
“真正认真对待软件的人应该打造自己的硬件。”——计算机科学先驱Alan Kay。面对软件系统日新月异的需求,定制硬件以加速软件运行,已成为创新的关键路径。亚马逊云科技在此领域独树一帜,不仅与顶尖芯片厂商深度合作,更自主研发多款芯片,并将其成功融入计算服务中。目前,量产的自研芯片阵容强大,包括Amazon Graviton系列(通用处理器芯片)、Amazon Trainium系列(机器学习训练芯片)以及Amazon Inferentia系列(机器学习推理芯片)。本次大会,Amazon Graviton系列与Amazon Trainium系列计算服务成为发布亮点。
Amazon Graviton系列再攀高峰,Amazon Graviton4荣耀登场。自2018年首推Amazon Graviton处理器以来,亚马逊云科技持续创新,不断突破。近期,更是推出了迄今最强大的Graviton芯片——Amazon Graviton4。这款新芯片单核计算性能飙升30%,虚拟CPU数量和内存容量均实现三倍跃升。值得一提的是,在亚马逊数据中心的新增处理器阵容中,Graviton系列已占据半壁江山,彰显其不可小觑的实力。更令人瞩目的是,亚马逊规模最大的1000家EC2客户中,超过9成已拥抱Graviton。以Pinterest为例,该公司在从数千个x86实例迁移至Graviton平台后,性能显著提升,计算成本大幅削减47%,碳排放量也锐减62%,实现了绿色计算与高效能的完美融合。
Amazon Trainium系列续写辉煌,Amazon Trainium2璀璨亮相。2022年推出的首款训练芯片Amazon Trainium1已初露锋芒,而去年宣布的Amazon Trainium2开发计划如今已硕果累累。本次re:Invent大会,亚马逊云科技正式宣布,搭载Amazon Trainium2的Amazon EC2 Trn2实例已在海外区域盛大发布。与当前一代基于GPU的实例相比,其性价比提升了30-40%,这一卓越性能令业界瞩目。每个Trn2实例均配备16个Amazon Trainium2芯片,这些芯片通过NeuronLink的高带宽、低延迟互连技术紧密相连,单个实例即可提供高达20.8 Petaflops的惊人计算性能。
亚马逊云科技再推创新之举,Amazon EC2 Trn2 UltraServer横空出世。这款超级服务器通过NeuronLink互连技术,将4个Trn2实例(总计64个Trainium2芯片)紧密连接在一起,单个计算节点的峰值计算性能突破83.2Petaflops大关。这一创新不仅为超大规模模型提供了前所未有的推理性能,更让超大规模训练集群的构建变得前所未有的高效。
值得一提的是,亚马逊云科技与Anthropic携手合作,共同打造名为Rainier项目的EC2 UltraServer集群。这一集群将动用数十万个Trainium2芯片,规模宏大前所未有,是此前集群规模的五倍之多。
代闻在会上透露:2025年后期,Amazon Trainium3将震撼发布!这款芯片首次采用3纳米制程工艺,计算速度翻倍,能效大幅提升40%!这意味着,客户将以更低廉的成本,轻松构建出规模更庞大、性能更强劲的应用,开启AI时代的新篇章!
数据服务战略升级
亚马逊云科技在存储服务领域再迈新台阶,其广受赞誉的Amazon S3迎来了里程碑式的重大升级。在本次盛会上,亚马逊云科技隆重推出了Amazon S3 Tables和Amazon S3 Metadata元数据服务两项创新功能。Amazon S3 Tables,作为一种专为Iceberg表量身打造的全新存储桶类型,实现了查询速度的三倍飞跃,每秒可处理的事务数量更是达到了常规S3存储桶的十倍之巨。而Amazon S3 Metadata元数据服务,则能够即时捕捉并深入理解S3中的数据,自动创建并近乎实时地更新可查询的元数据,为客户带来前所未有的数据管理便捷体验。
亚马逊云科技的Amazon Aurora数据库服务,凭借其对MySQL和PostgreSQL的完全兼容性,既秉承了商业数据库的卓越可靠性,又兼具开源数据库的高度可移植性。其性能相较于自托管开源数据库提升了3-5倍,而成本却仅为商业数据库的十分之一。为了打造更加臻善的数据库解决方案,亚马逊云科技匠心独运,开发出了全新的事务处理方法,将事务处理与存储层巧妙分离,实现了强一致性和极速的数据库写入。在此基础上,亚马逊云科技又推出了Amazon Aurora DSQL,这是一款全新的无服务器分布式SQL数据库,支持多区域近乎无限扩展,可用性高达99.999%,读写速度较其他流行分布式SQL数据库提升了整整4倍。同时,Amazon DynamoDB global tables也已全面支持多区域强一致性,无论客户选择SQL还是NoSQL数据库,都能享受到主动-主动的多区域部署、强一致性、低延迟和高可用性的全方位优势。
亚马逊云科技的数据分析服务涵盖了数据处理的各个领域,从数据仓库Amazon Redshift的稳健存储与管理,到大数据处理Amazon EMR的海量数据分析能力;从搜索分析Amazon Opensearch的精准定位与检索,到流数据分析Amazon Kinesis/Amazon MSK的实时洞察与监控;从数据集成Amazon Glue的无缝对接与融合,到交互查询Amazon Athena的灵活便捷;再到BI工具Amazon QuickSight的直观可视化与深度洞察,亚马逊云科技构建了一套完备的数据分析生态系统,为企业提供了全方位、一站式的数据解决方案。然而,亚马逊云科技并未满足于此,为了进一步提升数据分析的效率和价值,将这些组件精妙地整合到一起,推出了新一代Amazon SageMaker统一平台。这一平台集分析、数据处理、搜索、数据准备、AI模型开发与训练、生成式AI等全功能于一体,并通过统一的企业数据视图实现全面整合,全方位满足企业的AI应用需求。
模型、训练推理全面进化
代闻表示,“不存在一统江湖的单一模型,而是要因地制宜,选择最适合场景的模型”。亚马逊云科技此次推出了自研的全新前沿基础系列模型——Amazon Nova,以其丰富的类型和卓越的性能,为不同场景提供了量身定制的解决方案。
Nova Micro是文本到文本模型,能以极低成本提供低延迟响应;Nova Lite为成本极低的多模态模型,可快速处理多种输入;Nova Pro是功能强大的多模态模型,在准确性、速度和成本间平衡;即将推出的Nova Premier是其中能力最强的多模态模型,可处理复杂推理任务并指导定制模型蒸馏。此外,亚马逊还推出了图片生成模型Amazon Nova Canvas和视频生成模型Amazon Nova Reel。Nova Canvas能够生成高达2K*2K分辨率的图像,并内置控制措施确保满足负责任的AI需求;而Nova Reel则提供了极高质量的视频生成服务,延迟极低,使得视频制作更加普及。在预发布方面,亚马逊还展示了语音到语音模型以及Any to Any模型。语音到语音模型能够感知用户语音语气上下文,平滑地给予语音回馈,在情感交互类场景中具有重要意义;而Any to Any模型则支持从多种输入到多种输出的多模态转换,为用户提供了更多选择。除了Amazon Nova系列模型,亚马逊云科技还推出了Amazon Bedrock Marketplace,为用户提供了更多模型选择。用户不仅可以使用亚马逊云科技自研模型,还能与其他第三方模型进行无缝集成。
除了模型发布,亚马逊还推出了Amazon Bedrock平台,旨在优化AI推理的集成工具,使其更加易用。Bedrock平台提供了优化低延迟推理选项,其底层硬件由Amazon Trainium2芯片及服务器提供支持,并配备了合适的软件配套和平台支持。此外,Bedrock还推出了模型蒸馏功能,帮助用户在专业性、延迟和成本之间找到完美平衡的模型。在构建生成式AI过程中,亚马逊还关注到了数据处理、模型幻觉以及智能体协作等方面的挑战。为此,Bedrock平台提供了GraphRAG支持、自动推理技术以及智能体协作功能等解决方案。这些功能极大地简化了生成式AI的构建过程,提高了内容的准确性和相关性,并确保了系统按照既定规范运行。从选择合适的模型到优化模型,再到利用数据进行模型定制,Amazon Bedrock集成了开发生成式AI所需的所有能力。
应用侧赋能:让生成式AI触手可及
在亚马逊云科技的生成式AI技术栈顶端,Amazon Q以其全面的功能定位,正引领着AI助手的革新。无论是面向开发者的Amazon Q Developer,还是面向企业应用的Amazon Q Business,Amazon Q都致力于让生成式AI更加易用,触手可及。
Amazon Q Developer在编程问题解决能力方面名列前茅,并推出了自动化Agent,帮助技术人员自动生成和执行单元测试、生成文档和进行代码审核等。同时,Amazon Q还发布了针对传统工作负载的新功能,方便用户进行迁移和转译。Amazon Q Business则在企业场景中得到了增强,实现了与Amazon QuickSight等平台的无缝数据整合,并成为了企业所有数据源的标准索引。在re:Invent中,第三方ISV可以集成Amazon Q Business的索引功能,为各种应用赋能。Amazon Q Business还可以将复杂工作流程自动化,为第三方软件赋予生成式AI能力,并在整个工作流程中进一步实现自动化。
写在最后:
随着2024亚马逊云科技re:Invent活动的圆满落幕,我们不仅见证了科技巨头的创新实力,更深刻感受到了其全栈联动创新对企业未来的深远影响。此次大会,亚马逊云科技以其卓越的全栈创新策略,从基础设施到模型应用,全方位助力企业应用生成式AI,重塑未来发展路径。
从需求侧出发,亚马逊云科技精准对接企业需求,通过逆向工作法提供量身定制的解决方案。技术侧,自研芯片的发布、存储服务的升级,以及大模型和智能助手的推出,无一不彰显着其在技术创新方面的领先地位。这些创新成果不仅提升了企业的计算性能和数据处理能力,更为企业应用生成式AI提供了坚实的基础。
展望未来,亚马逊云科技的全栈联动创新将继续释放巨大价值,全方位助力企业在数字化转型的浪潮中勇立潮头,重塑未来。我们有理由相信,在亚马逊云科技的赋能下,企业用户将能够更好地拥抱生成式AI,开创更加智能、高效的未来。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )