7月28日消息(艾斯)“到2030年,全球边缘计算市场将达到4450亿美元。边缘的发展将会成为下个十年的一个巨大机遇,也是我们可利用的重要机遇。”英特尔公司高级副总裁兼网络与边缘事业部总经理Sachin Katti在本周于南京举行的2023英特尔网络与边缘产业高层峰会上发表演讲时说到。
来自中移智库的最新研究报告显示,行业多样化需求正在牵引新形态云快速成长,其中,边缘云正成为新的增长极。车联网、工业互联网等产生大量低时延存算需求,引发边缘云需求快速增长。据德勤报告预计,我国边缘云市场规模将从2022年的622亿元增长到2025年的1988亿元,复合增长率达47.5%。与此同时,智能云快速普及推广。国内外领先云服务企业正积极推动云智融合发展,普遍基于云提供AI平台、模型、应用等端到端产品服务。
Sachin Katti在接受C114等媒体采访时指出,“AI正在快速迁移到云端,在这当中,边缘会发挥更加重要的作用来推动AI部署。边缘已经是现在AI最大的部署所在。”面对边缘AI市场的巨大机会,英特尔采取了硬件结合的整体策略,一方面该公司提供大量具备一流性能的硬件选择,包括CPU、GPU、加速器等,另一方面,英特尔希望通过其软件解决方案帮助客户的运营降低复杂性、更加精简。更重要的是,英特尔正在携手广泛的合作伙伴一起为行业提供创新的定制化整体解决方案。
边缘已不再边缘
毫无疑问,如今所有行业活动都绕不开的一个话题就是AI大模型。现在大模型基本上都是在云端进行训练(中心化的训练),与此同时,这些在云端的训练有很多处于探索过程当中,不少行业正在对模型的成熟进行等待与观望。在Sachin Katti看来,随着大模型在云端训练的成熟,计算需求会快速向边缘进行转移。他分析称,当行业真正要去使用比较稳定的大模型时,就会考虑到数据的安全性,也就是隐私的问题,这对其来说是非常重要的。对很多企业来说,他们并不希望数据在云端进行完全开放,因此,将私有数据放在边缘进行计算和应用无疑简成为一种必然选择。
据调研机构预测,到2025年,75%由企业生成的数据将在传统数据中心或云之外进行创建和处理;到2026年,50%的边缘部署将涉及机器学习;86%的边缘开发人员将瞄准基于AI的应用程序;边缘的AI推理将是数据中心的3倍。正如英特尔公司副总裁兼网络与边缘事业部中国区总经理陈伟博士所言,“边缘不在边缘,边缘将成为主场。”Sachin Katti亦表示,“现在边缘的时代还处在早期阶段,英特尔及整个生态系统的合作伙伴都在携手努力去进行相应探索,在边缘计算方面会有巨大的增长。这个十年可以说是边缘的时代。”
不过,目前大多数的边缘AI项目无法成功落地。一是因为基础设施问题,大部分工厂环境中的设备比较陈旧,如何把AI大模型部署到这些陈旧设备上,将需要非常大的计算足迹;二是因为数据问题,因为每个行业(企业)的数据都是独特的,如何打破数据孤岛并非易事。英特尔中国区网络与边缘事业部首席技术官、英特尔高级首席AI工程师张宇博士就谈到,边缘AI的发展可以分为三个阶段:第一个阶段是边缘推理,第二个阶段是边缘训练,第三个阶段是边缘自主机器学习,而边缘AI目前绝大部分的应用还处于边缘推理阶段。
张宇认为,边缘重要性还体现在可持续发展上。由于超过75%的数据将放在边缘进行处理,而处理这些数据必将需要能耗,如何实现节能减排,尤其是在边缘实现节能减排有特殊的意义。英特尔在这方面做了大量的工作,包括对处理器架构进行更新以及增加各种专用加速引擎,如其第四代至强可扩展处理器当中所包含的vRAN Boost,就能够提升在无线接入侧系统的效率。据悉,集成vRAN Boost的第四代英特尔至强可扩展处理器,与上一代相比,能够在不增加功耗的情况下提供两倍容量,并额外节省高达20%的能耗,从而满足关键的性能、扩展和能效要求。
软硬结合实力拿捏
在采访中Sachin Katti强调,英特尔的价值定位是要把软件和硬件综合起来作为一个整体解决方案组合来提供给客户。“因为对于边缘来说,客户仅仅靠自己通过硬件去获得边缘价值是非常困难的。所以我们在给客户提供硬件的同时,相应也会交付客户所需要的软件。目的是希望通过可以让客户更加容易地部署和管理好硬件。在AI方面,我们希望通过软件可以让客户更加容易并且能够最好地去获得所训练的模型当中可得到的AI性能。”此外,他表示,英特尔也在专注于开放的网络连接技术,将大量的GPU和加速器连接起来,从而让大模型的训练更加方便。
本月上旬,英特尔在中国市场正式发布了第二代Gaudi深度学习加速器——Habana Gaudi 2。Gaudi2深度学习加速器的架构旨在高效扩展,以满足大规模语言模型及生成式AI模型的需求。其每张芯片集成了21个专用于内部互联的100Gbps(RoCEv2 RDMA)以太网接口,从而实现低延迟服务器内扩展。Gaudi2加速器的出色性能在6月公布的MLCommons MLPerf 基准测试中得到了充分认证,其在GPT-3模型、计算机视觉模型ResNet-50(使用8个加速器)、Unet3D(使用8个加速器),以及自然语言处理模型BERT(使用8个和64个加速器)上均取得了优异的训练结果。
另外,在此次峰会上,英特尔还发布了第二代英特尔 NetSec加速器参考设计。这款全新加速卡基于英特尔至强D系列处理器而打造,创新性地将一台x86服务器设计成智能网卡形态,可大幅减少系统的空间占用和功耗。基于英特尔 NetSec 加速卡参考设计实现的首款产品将由合作伙伴量产上市,在最大程度满足软件定义、自动化和弹性扩展的同时,让客户享受到更安全、更可靠、更灵活及更高效的智能计算体验。
在软件层面,英特尔近期发布了 OpenVINO 2023.0版本,可以从更大程度上帮助AI开发者简化工作流程,在企业中更高效地部署高质量的计算机视觉AI解决方案,以推动创新和自动化发展。据介绍,OpenVINO可以把在云端进行的大模型训练成果在边缘进行压缩和优化,从而可以使大模型得到更加广泛的使用。同时,通过用于数据上传、标注、模型训练和再训练的单一接口,英特尔Geti商用软件平台能够帮助开发团队减少模型开发所需时间,并降低AI开发技术门槛及开发成本。
张宇指出,算力和网络能力是整个大模型平台整体性能的两个关键要素。他介绍到,作为英特尔刚成立不久的一个新事业部门,英特尔网络与边缘事业部所提供的的产品之一为IPU(Infrastructure Processing Unit),该产品能够为用户提供一个可靠的数据的传输,来满足大模型训练里头对网络可靠性、丢包率的严格要求,同时它能够达到100G、200G甚至更高的线速,可以满足大模型训练对网络速度的要求。“在大模型方面,英特尔的产品实际上涵盖了计算、通讯等各个领域,我们可以给客户提供一个相对来说比较全面的方案。”他表示。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。