科技云报道原创。
云计算价格战的硝烟尚未散去,全球AI大模型也卷出了“骨折价”。
今年以来,OpenAI、Mistral AI、通义千问、智谱AI、文心一言纷纷祭出降价“撒手锏”。
在海外,法国人工智能企业Mistral AI大模型Mistral Large的输入、输出价格比GPT-4 Turbo便宜约20%。OpenAI推出新一代旗舰AI模型GPT-4o,其API价格下降50%。
国产大模型在降价上也“不甘落后”。通义千问2.5性能基本追平GPT-4 Turbo,个人用户可从App、官网和小程序免费使用。
智谱AI将入门级大模型GLM-3 Turbo调用价格下调80%,1元就可以购买100万tokens。字节跳动豆包大模型开启对外服务,根据火山引擎公布的价格计算,1块钱就能买到豆包主力模型的125万Tokens。
究竟是什么原因引发了大模型这轮波澜壮阔的降价潮?降价后大模型将往何处去?值得我们研究。
全球大模型掀起降价潮原因几何?
任何技术最终的落脚点都是实用性、易用性和性价比的三者统一,没有例外。
无论是当初的电商、外卖、手机,还是如今的新能源汽车、大模型,当技术发展到一定阶段,竞争到最后都会遵循价格第一的铁律。目前,全球大模型产业不约而同地掀起“降价潮”,也正印证了一个规律:性价比是商业最高真谛,贵不等于值得,划算才是。
在新技术或新产品追求大规模商业化落地过程中,“降价”策略得以使新技术和产品得到最快速度、最大限度的普及,也成为科技企业技术商业化的必然路径。
全球大模型头部企业OpenAI于近日宣布最新GPT-4o多模态大模型,其在保持与GPT-4同等智能水平的基础上,实现了文本、图像和语音处理的全面提升,同时GPT-4o将免费开放给所有用户,整体API价格相比于前代也下降了50%。
事实上,这已不是OpenAI在商业化道路上的第一次降价。以GPT-3.5系列的输入成本为例,2023年3月首次降价90%,6月再次降价25%,到了2024年2月,进行第三次降价50%。
反观国内,以具有代表性的大模型头部企业智谱AI为例,去年6月,在科技媒体The Information的盘点中,智谱AI被视为最有可能成为“中国OpenAI”的5家企业之一,其一举一动在业内具有风向标性质。
智谱AI的大模型开放平台bigmodel.cn于近日上线了全新的价格体系。新注册用户可以获得额度从500万tokens大幅提升4倍,至2500万tokens,入门级产品GLM-3Turbo模型产品的调用价格更是断崖式下降80%,从5元/百万tokens直接降至1元/百万tokens,堪称“价格屠夫”。
我们看来,降价并非简单粗暴的价格战,而是充分释放让利空间,是技术、规模带来的正循环。目前,大模型应用发展仍处于早期阶段。QuestMobile数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。而降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。
“数据飞轮”在大模型进化过程中的作用不可忽视,通过客户在应用程序中输入的提示词这样的数据反馈,使大模型快速迭代。
通过降价,一方面用户不仅感受到了大模型应用带来的便利和高效,大模型企业还可以更快速地吸引用户,通过用户反馈数据加速大模型迭代升级,另一方面帮助大模型企业抢占市场份额提高营收,以对冲高昂的研发投入,真正实现“技术-场景-盈利”的商业化闭环,同时随着大模型应用场景的开拓,还会衍生出更多的微调及推理等需求,进一步带动国内AI应用的繁荣发展。
从这个角度来讲,大模型降价这事无论对于个人用户还是企业用户都是一种双赢。
大模型迈入“普惠时代”
通过对比通义千问、文心一言、百川、MiniMax、月之暗面等入门级产品API调用价格不难发现,智谱AI此次降价幅度之大前所未有。
价格调整后,使用GLM-3 Turbo创作一万条小红书文案(以350字计)将仅需约1元钱,足以让更多企业和个人都能用上这款入门级产品。
除了个人版GLM-3Turbo,智谱AI的企业级产品GLM-4/GLM-4V价格尚未出现大幅波动,仍维持在0.1元/千tokens,百万tokens的价格为100元。作为一款能力逼近GPT-4的国内领先大模型,GLM-4这一价格还是具有明显优势。
再与OpenAI价格进行对比,其最新模型GPT-4 Turbo每100万tokens输入/输出价格分别是10/30美元。Claude 3 Opus则更贵,每百万tokens输入/输出价格15/75美元。
在这轮降价潮中,我们可以隐约看到“摩尔定律”也在深深影响着大模型行业。伴随大模型价格下降的是性能的大幅提升。
今年3月,清华大学基础模型研究中心联合中关村实验室发布的《SuperBench大模型综合能力评测报告》显示,GLM-4已然闯入第一梯队,与GPT-4、Claude-3等国际一流模型水平接近,且差距已经逐渐缩小。
2023年3月,智谱AI推出千亿开源基座对话模型ChatGLM系列,并在过去一年内完成4次升级,于2024年1月推出新一代基座大模型GLM-4系列,整体性能相比上一代提升了60%,已经逼近GPT-4。
它能够支持128k的上下文窗口长度,与GPT-4 Turbo相当,同时具备更强多模态能力,效果超过开源SD模型,逼近DALLE-3。
为进一步降低大模型使用门槛,智谱AI推出智能体定制功能,用户只需使用简单的提示词指令,就可以创建属于自己的智能体。
任何人都可以自由运用GLM-4模型,即使没有任何编程基础,也能便捷地进行大模型开发。正是得益于GLM模型的强大的智能体能力,GLM-4实现了自主根据用户意图,自动理解、规划复杂指令,从而完成更加复杂的任务。
技术的持续进步为降低开发大模型成本提供了现实可能。智谱AI通过模型推理算子优化、模型压缩及硬件高效适配、高性能系统实现,以及精细化集群调度等技术,将GLM-3 Turbo推理成本进行大幅压缩。
自大模型开放平台上线以来,在模型效果和推理性能不断提升的情况下,已累计降价超过百倍,这无疑也给了智谱AI将API调用价格打至“冰点”的底气。
一直以来,大模型给外界的印象是贵、小众。事实也确实如此,在行业发展初期,由于还未形成规模效应,厂商的成本一直居高不下,很多企业和开发者只能望洋兴叹。
但智谱AI等大模型厂商此次调价向行业和公众宣告这样一个事实:优质的大模型,不一定要花大价钱,“技术普惠时代”已经到来。
所谓的“技术普惠”,就是坚持致力于突破技术壁垒,让更多前沿科技以大众更能接受的价格走进生活,让更多人有机会享受到科技带来的便利。
“强性能+好价格”是技术普惠的最大特征,智谱AI正在沿着这条路前行,其开放平台上已经聚集了超过数十万的企业和开发者,并且在持续快速增长,过去的半年每日的token消耗增长超过一百倍。
比如官方开发的三个调用工具,网页检索、函数调用以及知识库,自从1月上线以来调用次数已经超过3亿次。
智谱AI CEO张鹏曾表示:“虽然目前技术已经非常快速地在呈现,但仍有很多问题值得去探索。智谱着眼于通用人工智能(AGI),这里的每一个问题的突破都有可能实现飞跃式发展,我们还远未达到技术的天花板,但曙光已现,2024年是向AGI发起冲锋的起始年份。”而此轮凌厉的降价,预示着智谱AI吹响了向AGI发起冲锋的号角。
商业化先行者已立潮头
虽说大模型这两年很火,但质疑之声仍不绝于耳。
其中一个很重要的原因,就因为现阶段做大模型每天的投入可能成百上千万,但很多的产品目前商业化程度并不高,有点像“砸钱赚吆喝”。
虽然“高投入”依然是主流大模型赛道玩家的主色调,但近两年,基础大模型及上层应用服务商的盈利能力明显在增强。同时,大模型应用在C端涌现出了不少现象级产品,但很多仍处于以免费模式获客到商业转化的阶段,营收规模并不突出。
在这其中,OpenAI较早开始商业化尝试,2022年对外的营收是2800万美元,2023年ARR增至16亿美元,激起了业内的无限联想。不过,OpenAI爆发式的营收增长和其丰富的业务线、市场占有率、以及B端、C端的双布局也有很大关系。
对比国外,国内企业级大模型服务的渗透更快,发展势头也更猛。在B端需求井喷以及客户群较高的付费能力的推动下,《中国AIGC应用全景报告》预测,国内AIGC应用市场2024年底有望增至200亿规模,预计2030年可达万亿规模。
从目前来看,底层通用大模型赛道多采用开放API接口的形式,扩大客群,最终按实际消耗或调用的tokens量收费。对于主流的大模型应用来说,按订阅费、调用费以及定制化收费显得更常见。
比如OpenAI的另一条业务线DALL-E 3,虽然没有公布明确的商业计划,不过它更多向ChatGPT的付费版/企业版用户开放,充分放大了ChatGPT会员订阅的吸引力。
反观智谱AI,其大模型开放平台bigmodel.cn,被视为公司今后大模型应用和商业化的重要接口之一,其平台生态也日益壮大。截至目前,智谱AI已有超过2000家生态合作伙伴、1000家规模化应用和200家深度共创客户。
通过采用降价策略,智谱AI率先抢占市场一角,吸引大量企业和开发者对API的调用,当企业和开发者形成平台粘性后,实现大规模营收也就是顺理成章的事情了。
在大模型的激烈竞争中,智谱AI率先拿起“价格屠刀”,无疑将带给行业不小的压力,但也加速了整个行业的商业化进程。
对于大模型厂商而言,价格战既是压力也是前进的动力,但对于企业和开发者而言,则是实实在在的利益和价值,有助于加快大模型行业应用创新落地。
但最终市场蛋糕能做多大,将取决于能否落地合适的业务场景,打造商业闭环,同时也是对大模型应用服务商自身的产品和服务实力的深度考验。
可以预见的是,未来大模型一定是技术、成本、性价比三者的平衡,国内大模型厂商通过不断在B端和C端进行持续探索,将为大模型打通商业化闭环提供了切实可行的路径。尽管前路挑战重重,但随着技术的普惠发展,我们相信,大模型全民普及时代正加速到来,一个充满机遇和创新的新纪元已为时不远。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、数博会、国家网安周与全球云计算等大型活动的官方指定传播媒体之一。深入原创报道云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。