强强联合背后,国产大模型迎来“WIntel时刻”?

配图来自Canva可画

在ChatGPT持续引爆行业通用大模型之后,国内诸多互联网巨头、AI企业,也都选择纷纷跟进,参与到国产通用大模型的角力之中。值得注意的是,与上半年“热闹非凡”的行业境遇不同,具备实力且具备满腔“产业抱负”的巨头玩家,正在为大模型的大规模落地创造机会。

其中,以科大讯飞为代表的科技公司,正在积极与包括华为等在内的国内合作伙伴一起通力合作,为构建人工智能时代的中国“Wintel联盟”做准备。而随着越来越多的实力型玩家大踏步入场,“大模型+”的应用拐点正在加速到来。

大模型迈入产业“落地”加速期

从国内大模型的发展状况来看,随着各路技术企业的纷纷参与,无论是通用大模型还是垂直行业大模型,国内企业均有涉足。一波接一波的行业浪潮席卷而来,正在推动整个“大模型+”应用时代的来临。

首先,大模型不再局限于聊天、答题、内容生产等C端应用,而是转向更偏重实体领域的B端应用,以“实用”为导向的大模型日渐成为行业趋势。

在上半年的持续“爆火”之后,进入下半年大模型的风向明显变了。市面上越来越多的“面向B端”的应用开始出现,这种“实用主义”的风向,大大加速了生成式AI产业化的进程。从上半年以来,陆续有京东、携程、网易有道、用友等不同领域的巨头,发布相关的行业大模型应用,包括腾讯、华为等在内的巨头,也将“实用”作为大模型应用的重点,推动大模型渗入产业实体之中。

其次,具备通用能力的大型企业,正在加强与各行业大模型企业的合作,新的大模型生产机制正在成型。

目前来说,业内通用的做法是,通过开放自身的大模型能力,为行业大模型开发提供必要条件。比如,讯飞星火大模型采用了“1+N”的整体布局,即借助讯飞星火大模型平台的7大通用能力,将其文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力等赋能给其他行业场景,形成在教育、医疗、汽车、法律等诸多领域的行业大模型应用的生产机制。依托这种生产机制,各行业的大模型厂商,都不再需要“重复造轮子”,只需要专注应用开发,即可推动行业的大模型场景落地,这些条件的具备,为大规模的大模型场景落地奠定了很好的基础。

“实用”大模型并非一蹴而就

如前文所述,随着国内大模型逐步深入产业,以及通用大模型厂商逐步对外开放自身能力,“实用”大模型的难度已经大大降低,但这并不意味着做“实用”大模型可以一蹴而就,甚至可以说与之恰恰相反。

其一,“实用”的大模型,通常需要企业具备很深厚的行业经验和专业数据积累,以确保数据的精准性和专业性,而这通常需要大模型企业对行业有很深的了解。就拿本次1024开发者节上科大讯飞发布的智能编程助手iFlyCode2.0来说,其自发布以来就持续升级,目前已成为行业重要的提效工具(内测数据,在编程的设计阶段提效50%、编码阶段提效37%、测试阶段提效44%)。然而,这样的能力很多企业并不具备,就如同射箭比赛,它们可能还不具备“画靶子”的能力。

以教育行业为例,大模型中关于“小学生英语学习”的版块,首先需要了解小学英语的学习目标,还要定义小学生英语学习的范围,不能超纲(比如词汇量范围、语句类型、语句长度等等),并要找到适合孩子学习习惯和学习阶段的方法——这些标准,都要先定义,这就是“画靶子的能力”。相比之下,从2004年至今,科大讯飞已经在智慧教育领域深耕19年了,多年来其深度参与了中国的教育信息化整个进程,从中小学到高等教育,从教学过程到教学结果诸多场景,系统积累了诸多从0到1的关键性技术,这使其积累了其他厂商难以企及的专业经验和专业数据,而这正是其他厂商短时间难以企及的。

在本次发布会上,搭载了星火大模型V3.0 讯飞AI学习机再度升级,首次发布启发互动式英语AI答疑辅学功能,实现个性化解决、启发引导式提问、互动探究式学习。同时,基于讯飞星火打造的AI心理伙伴正式发布,它具备多模态情感识别、共情表达、寻因式提问、个性化心理指导四大核心能力,全方位呵护孩子的心理健康。

实际上,科大讯飞在细分行业领域积累的经验不仅限于教育,包括医疗、智慧城市、金融、法律、工业等诸多领域,科大讯飞也均有丰富的经验,而这正是其可以面向诸多垂直行业推出“大模型+”的底气所在。比如,在此次科大讯飞1024开发者节上,科大讯飞推出了医疗大模型和讯飞晓医APP,为每个家庭提供健康助手,正是基于科大讯飞在智慧医疗行业的多年积累,科大讯飞的智医助理在2017年就以456分(合格线360分)通过了国家临床执业医师资格考试,目前已覆盖426个覆盖区县,累计辅助诊断次数6.9亿次。

此外,为了进一步加速大模型行业落地,科大讯飞联合行业龙头共同发布12个行业大模型,包含金融、汽车、运营商、工业、住建、物业、法律等行业,加速产业升级。

其二,行业大模型本身的门槛,使得它对大模型企业提出了很高的战略要求。从大模型技术密集、资金密集、技术迭代快的特点来看,任何不具备超强研发实力的企业,都很难经得起市场的考验。但从国内人工智能行业发展现状来看,目前我国“人工智能+行业”的投入最多不过10来年时间,专业的人工智能人才成长起来,则至少需要5年以上的技术和行业经验,但当下很多行业内的人员,远远达不到这一水平。而作为国内最早做人工智能的科技企业,讯飞在该领域深耕已经25年了,人才基础好、团队信任度高,高中腰部人才梯队完备,这使其具备很强的研发实力,因而在大模型上它更够实现有效转化,对市场风向的预测也更加精准,更容易推陈出新、加速技术迭代。

其三,大模型本身的复杂性,使得大模型的落地并不能仅仅依靠一家企业的能力,而是需要有号召力的科技巨头来发挥牵引作用,推动整个产业生态的完善和壮大。作为一家有影响力的技术巨头,科大讯飞具备强大的产业协作能力,这是其能够实现技术成果“井喷”的重要因素。

比如,在本次科大讯飞1024开发者节上,其不仅展示了为数众多的各种大模型产品,还展示了庞大的产业生态,这里汇集了几十种展品,更有搭载星火认知大模型的开放平台,联合550多万开发者,共同打造技术、场景、服务多元赋能的共创共荣的AI生态。也正是基于以上诸多优势,科大讯飞才能够在推动大模型落地行业方面先人一步。

抢占算力制高点已成破局关键

从行业来看,大模型的复杂性要求厂商必须做到“十项全能”,算力、算法、数据、资金、人才,团队都必须足够优秀,缺一个都不行,可见AI大模型本质上是一场赢家通吃的游戏。而在诸多因素之中,抢占高性能算力,已经成为当下国产厂商突破技术瓶颈的核心关键。

一方面,是中国AI算力需求呈现出高速增长的态势。另一方面,随着国内大模型的蓬勃发展,支撑AI核心算力的高性能算力面临短缺,算力吃紧的局面日益凸显。硬件层面,由于国内高端GPU芯片的缺乏,使得国外发布的高性能算力芯片一经发布就遭到了哄抢,产品价格也水涨船高,还时刻面临“缺货”的风险。软件层面,AI时代大量使用的张量计算也跟传统计算机时代的方式不同,AI算力需求的迅速增长,要求国产大模型厂商不仅要注重算力芯片的硬件建设,还需要注重基础软件的创新。也就是说,想要做好大模型训练,不仅要做到硬件层面的更新换代,还需要软件层面的持续创新。

目前来看,想要发展大模型要么发力自研,要么高价购买外国芯片承担风险,而科大讯飞选择了第三条路,与华为展开合作,共同致力于国产AI大模型的自主创新。作为当前国产自主算力的代表作之一,华为昇腾平台凭借华为自研的达芬奇架构技术,实现了业界最佳性能与能效,支持云边端全栈全场景应用。目前华为昇腾的AI集群已经全面升级,已经从最初的4000卡集群扩展到16000卡集群,是业界首个万卡集群,拥有更快的训练速度和30天以上的稳定训练周期。

早在今年7月份,就有报道介绍,在充分利用昇腾这样的国产化算力平台基础上,讯飞搭建了自研的火石平台。该平台突破了大模型数据的系数化,低精度的量化以及高效适配等问题,加速了AI大模型的落地。同时讯飞星火也实现了训练和数据闭环的全流程设计,大模型训练和推理的一体化设计等等创新工作。在10月24日的开发者节上,科大讯飞更是宣布将联合昇腾AI打造算力底座“飞星一号”,进一步将双方的合作提升到一个新的高度。

自主算力和自研平台的结合,对于国产大模型来说有着深远的意义。

据预计,借助双方不断升级的算力基础设施,科大讯飞将参与到更大规模的参数训练之中去,为赶上乃至超越GPT-4奠定基础。同时,借助高效、稳定、安全可控的国产算力基础设施,更多普惠行业的国产AI应用成果或将迎来“大爆发”。比如,在本次开发者节上,科大讯飞就展示了包含金融、汽车、运营商、工业、住建、物业、法律等诸多行业大模型,这些技术成果的集中涌现,充分说明了底层原生技术的重要性。

国产AI大模型“Wintel时刻”已至

从业内来看,目前业界对于大模型落地的探索,已经初步分化出了不同的路线。具体可分为三种类型:第一种是按照使用量收费模式,就是通过AI公司研发大模型并对外提供应用产品或API;第二种是谷歌模式,即从底层TPU芯片,到云基础设施再到大模型产品全部自研;第三种则是“OpenAI+微软”模式,双方各自发挥自身的优势相互配合,共同助力大模型产业的发展,有点类似PC时代的“Wintel联盟”,这和科大讯飞与华为的合作有异曲同工之妙。

作为个人计算机历史上的一大里程碑,Wintel联盟无疑是史上最成功的产业联盟之一,其成功之处在于,通过将微软Windows操作系统和英特尔硬件融合,使之达到了三个方面的效果:第一,软硬件的兼容性,极大地降低了产业成本提高了行业效率;第二,微软的软件和英特尔的硬件相互配合、优势互补,各自将自身优势发挥到最大;第三,软硬件相互推动,加速产业迭代和创新。比如,微软软件的创新,会推动英特尔加速硬件的性能提升;而英特尔硬件性能的提升,也会加速微软软件的迭代,由此形成不断强化的产业飞轮,同时成就了微软和英特尔两大PC霸主。

如今,同样的事情也在人工智能领域开始上演了。比如,全球云巨头亚马逊就与HuggingFace等开源新势力展开了合作,大数据巨头Databricks豪掷13亿美元收购大模型初创公司MosaicML,微软和OpenAI的合作等都是这一思路的延伸。

而从目前国内大模型企业的发展情况来看,围绕做产业生态的思路,已经有越来越多的产业联盟开始在大模型领域渐次铺开,科大讯飞与华为的牵手,无疑是一个很好的行业示范。作为整个产业链、生态链中的核心企业,它们的牵手可以起到“牵一发而动全身”的作用,带动整个产业生态迅速完善起来,从而为更高质量的大模型发展铺平道路。

科大讯飞董事长刘庆峰在1024开发者节的主论坛演讲中说,2014年上半年,讯飞星火将对标ChatGPT4:“这绝不仅仅是一个简单的技术对标问题,我们要走出自己的技术路线,走出自己的产业方向,形成自己完整的生态。从这个角度来说,大模型时代的序幕才刚刚拉开!”

相信随着更多产业生态的建立和完善,国产AI大模型或将迎来属于自己的“Wintel时刻”,届时作为核心企业的科大讯飞,也将受益于整个产业的进步构建起更强大的生态壁垒。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2023-10-25
强强联合背后,国产大模型迎来“WIntel时刻”?
强强联合背后,国产大模型迎来“WIntel时刻”?

长按扫码 阅读全文