走出AI大模型“焦虑症”,政企行业找到了“最优解”

极客网·极客观察(朱飞)6月26日 自2022年底以来,随着ChatGPT横空出世并迭代升级,全球各国、各行各业面对AI大模型似乎都FOMO了(Fear of Missing Out,错失恐惧症),动作频频生怕错失机遇。

然而迄今为止,在轰轰烈烈的“炼大模型”过程中,除了英伟达赚得盆满钵满外,其他玩家都还没找到稳定且持续的商业模式。相反,随着参数规模的日益膨胀,模型训练的算力开支越来越高,大投入却看不到产出的情况下,新的“焦虑症”又蔓延开来。

图片1.webp.jpg

在大模型“军备竞赛”最激烈的美国,资本市场近乎进入“癫狂”状态。这两年来,美股市场只要跟AI相关的股票都涨疯了。苹果一个AI进展发布会,隔天市值就上涨2142亿美元;以微软为首的美股“Big 7”的市值,更是达到史无前例的14万亿,占据标普500的32%,纸面市值与实际价值倒挂,“癫狂”程度史无前例。投行分析师们开始焦虑一个比互联网泡沫更大的AI泡沫即将到来。

在中国互联网圈,巨头们焦虑与美国的差距的同时,开始不断压低每Token的价格,提前开启简单粗暴的价格战。其中,字节跳动豆包大模型将通用模型pro-128k版的推理输入价格定在0.005元/千tokens,较行业锐降95.8%;阿里通义千问将主力模型Qwen-Long的API输入价格降至0.0005元/千Tokens,直降97%;百度甚至宣布将文心大模型的两款主力模型ENIRE Speed和ENIRE Lite全面免费。

一方面是AGI的崇高理想,另一边是ROI的残酷现实,面对AI大模型这班开往未来的列车,不“上车”不行,“上车”后找不到好位置、坚持不到终点也不行,到底该何去何从?

在中国政企行业,一群富有远见的先行者将通用大模型与特定行业的专业知识相结合,打造属于自己的专属大模型,以加速行业AI应用落地,真正兑现大模型的价值,为业界走出AI大模型“焦虑症”找到了“最优解”!

中国大模型摆脱“焦虑症”,破局之路在行业

从全球“大模型之争”开启之初,“中美在AI领域差距有多大”就一直都是公众关注的热点议题,从1~2年到8~10年不等。

必须承认,我国在算力、算法和数据领域其实并不具备优势:高端算力卡被英伟达卡脖子无法供应,短时间内自有制程和设计又无法跟上;算法领域,虽然模型数量众多,但大多数是基于国外开源架构优化,缺乏自主性和领先性;数据领域,我们的开放数据和国外不在一个数量级上,中文语料严重不足。

这些差距是短期内难以抹平的,这时候,缩短差距的正确打开方式,自然不是以己之短博人之长。

从另一个角度看,我国有全球唯一的全工业门类、最多的金融消费人群以及最大规模的政务和城市体系,产生了丰富的场景和私有数据,这些都成为发展行业大模型的天然土壤。因此,比拼应用成为中国大模型破局的一条有效路径,通过大模型赋能一个个行业细分场景,最终形成战略突围。

图片2.webp.jpg

以差异化优势入局,可以预见,今天率先拥抱大模型的行业企业和组织,面对的将是一个划时代的重大战略机遇。

政企行业大模型挑战重重,工程化能力是“胜负手”

当然,站在新时代的起点,政企行业打造大模型,依然是挑战重重,因为大模型的应用本身就是一个复杂的系统工程,除了单点技术的持续突破外,更需要基于场景和需求匹配合适的技术,通过全链路、多技术融合的系统性创新整体推进。

图片3.webp.jpg

首先,大模型不是孤立的技术,必须重视软硬件基础设施的协同发展。除了大模型本身,我们还需要关注其背后的技术生态系统,包括开发工具、计算架构以及硬件设施如算力、存储和网络。在设计和验证过程中,必须考虑性能、可靠性、可维护性和兼容性,确保系统的高效和稳定运行。

第二,行业大模型需要AI-Native的基础设施。一般企业可以直接选择公有云享受云上的充沛算力,但对于政府、金融、电力等大型政企而言,为了满足安全合规要求,混合云才是更优选,即先借公有云的超大算力和数据训练基础大模型,再在私有云里结合私有数据二次训练得到企业专属大模型,最后在边缘云推理实现场景化应用。

第三,大模型需要建立AI开发工作流,促进模型确定性交付。大模型的开发是一个复杂的系统工程,需要跨团队协作和迭代开发。为了提高开发效率和质量,需要建立一站式的AI开发工作流,实现标准化和自动化,减少开发过程中的不确定性。

第四,大模型需要重视数据工程,打造优质数据集。高质量的数据是大模型成功的关键。目前中文数据集与英文存在差距,需要通过建立数据工程能力,优化数据的供应、流动和使用,为大模型高质量供数。

第五,行业大模型不适合孤军作战,需要着力培育产业生态。生态是发展大模型不可或缺的一环,这需要政府和行业头部企业从技术生态、数据生态、模型生态和应用生态四个层面,去构建AI时代开放、可闭环、有质量的生态体系。

最后,大模型不是一锤子买卖,需要持续运营与优化。大模型运营和建设同样重要,持续的运营和优化对于大模型平台的长期价值至关重要,这要求企业建立适合的流程、组织结构和人才队伍,不断优化现有场景并探索新的应用领域。

一言以蔽之,行业大模型考验的不是单项能力,而是全流程融会贯通的工程化能力。

先行者迈出坚实步伐,行业大模型未来可期

综上不难看出,尽管当前大模型在技术和价格上卷得如火如荼,但其兑现价值的“主航道”在行业,真正的赛点在于落地。在行业大模型的大赛道上,不盲目追求堆算力、堆参数量,而是聚焦技术与场景的深度融合,踏踏实实积累工程化能力,帮助行业大模型落地才是关键。从这个层面讲,AI for industries的华为云与政企行业先行者的联合创新实践,可谓走在了正确的道路上。

去年,华为云就率先发布业界首个大模型混合云华为云Stack。在近期的华为开发者大会上,华为云更进一步发布大模型混合云十大创新技术,包括多样性算力调度、算子加速、云边协同等等。既有根技术研发实力,又有业界最全的AI大模型全套工具链和软硬件产品,华为云Stack一套组合拳下来,行业大模型的焦虑也被治好了大半。

图片4.webp.jpg

比如,从2022年开始,山东能源集团携手华为云基于混合云打造全球首个矿山大模型,已在煤矿领域9个专业40多个场景应用实践。今年1月,鄂尔多斯与华为联合打造内蒙古首个以行业AI大模型为核心的工业互联网平台,在煤矿领域提升、主运、安监、防冲、采煤、掘进、辅运、洗选、焦化等9个专业实现了26个场景智能化,达到可视、可管、可溯规范化作业,提升安全生产能力的同时有效提高了生产效率和效益。

更值得注意的是,先行政企的行业大模型不仅是自建自用,更是在牵头打造示范场景并沉淀经验,对外输出向行业赋能。比如,鄂尔多斯工业互联网平台目前已完成44个AI大模型应用开发,上架270多款商品,为28家AI企业、16家矿鸿企业共44家应用开发者以及当地300多家矿山生产企业提供了开放可靠的交易平台。

展望未来,相信在华为云及产业上下游各方的共同努力下,依托我国场景丰富的优势,大模型必将能够打开更广阔的行业智能化天地,加速迈向智能世界,释放更大的经济和社会效益!

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-06-26
走出AI大模型“焦虑症”,政企行业找到了“最优解”
自2022年底以来,随着ChatGPT横空出世并迭代升级,全球各国、各行各业面对AI大模型似乎都FOMO了(Fear of Missing Out,错失恐惧症),动作频频生怕错失机遇。

长按扫码 阅读全文