5月20日,电商年中大促“618”正式开启,各家电商平台还在忙着统计首日战报,大模型价格战已经率先打响,甚至比618还要猛烈。
21日上午,阿里云抛出重磅炸弹,通义千问GPT-4级主力模型Qwen-Long,API(应用程序编程接口)输入价格从0.02元/千Tokens降至0.0005元/千Tokens,直降97%,相当于GPT-4价格的约1/400。
上周,字节跳动发布豆包大模型,并宣布豆包通用模型pro-32k版的推理输入价格为0.0008元/千Tokens,首次将大模型价格带入“厘时代”。如今,通义千问的价格比豆包大模型还要便宜。
按照上述价格计算,1元能买到豆包主力模型的125万Tokens,相当于3本《三国演义》,而1元也可以买到通义千问主力模型的200万Tokens,相当于5本《新华字典》。
这还没完,当天下午,百度直接宣布,旗下两款大模型ERNIE Speed、ERNIE Lite免费。这两款产品是今年3月百度推出的“轻量级”大模型,相比通用大模型,轻量级大模型的推理成本也会更低。
那么,问题来了,字节、阿里、百度三家大厂已相继宣布大模型降价,腾讯会不会跟进?
日前,腾讯云副总裁、腾讯云智能负责人吴运声在接受采访时,没有明确回答是否会加入大模型价格战,他表示,“腾讯更关注大模型能力的提升,致力于为行业提供能力和价格兼具的产品。”
从卷技术到卷价格
前两年,大模型公司还沉浸在拼参数量、拼文本长度。今年以来,整个行业从卷技术到卷价格,大模型降价已成趋势。
在字节等大厂纷纷宣布降价之前,已经有不少厂商下调大模型使用价格。
5月6日,AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2,该模型API定价为:每百万Tokens输入1元、输出2元(32K上下文),仅是GPT-4的近百分之一。
5月11日,智谱大模型官宣新的价格体系,入门级产品GLM-3 Turbo模型调用价格从5元/百万Tokens降至1元/百万Tokens,降幅高达80%。
这样的趋势,同样在国外发生。今年2月底,法国AI公司Mistral AI发布最新大模型Mistral Large,该模型输入、输出价格比GPT-4 Turbo便宜约20%。
而自去年以来,OpenAI已经进行了4次降价,其最新发布的多模态大模型GPT-4o,不仅性能有了很大提升,价格也下调了50%。
降价背后是大模型结构、训练等成本的持续优化。李彦宏曾在Create 2024百度AI开发者大会上透露,与一年前相比,文心大模型推理性能实现了105倍增长,而推理成本却降到了原来的1%。
今日,创新工场董事长兼CEO李开复在接受媒体采访时表示,在一定程度上,整个行业每年降低10倍推理成本,这是可以期待的,而且是必然也应该发生的。“今天可能是处在一个比较低的点,但是我觉得如果说以后大约有一年降价10倍来看的话,这是一个好消息,对整个行业都是好消息。”
此外,火山引擎总裁谭待也曾表示,市场对降价的呼声比较高,平台必须把试错成本做到非常低,才能让大家用起来。只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。
为什么要打价格战?
现在,大模型还是一个高投入、低产出的行业,为什么厂商还要打价格战?答案也很简单:加速商业化落地。
大模型卷到2024年,一个新的赛季已经打响,应用场景的落地成为竞争主旋律。大模型定价的持续走低有望带来更快的商业化落地。
上周,OpenAI、谷歌、字节跳动、腾讯四家大厂相继披露在大模型领域的最新进展,无一不聚焦在应用侧。
硬核如OpenAI,对于最新发布的多模态大模型GPT-4o,也没有以往对参数指标的生硬强调,而是选择集中展示多场景下的用户体验。这被认为是OpenAI加速应用落地的表现。
在腾讯云生成式AI产业应用峰会上,吴运声在谈及大模型商业化的问题时表示,技术的突破未来一定会带来商业化的机会,而且会呈现跨越式的增长态势。AI要真正落地实用,推理成本的降低、工程性能的极致优化至关重要,是未来商业化取得突破的重要因素。
当天,腾讯集团副总裁蒋杰在大会上宣布,腾讯混元大模型通过持续迭代,目前整体性能已居国内第一梯队,部分中文能力已追平GPT-4。
值得一提的是,目前大模型的应用还在早期阶段,仍有很大的发展空间。QuestMobile数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。
海通证券5月17日研报指出,伴随国产AI大模型的持续升级,2024年有望成国产AI大模型全面商业落地的元年,先进的AI大模型能力也将逐渐转化为落地实际场景的产品应用,从而带动AI大模型在金融、教育、法律、医疗等众多垂直行业的持续落地,AI2B与AI2C的需求天花板也有望全面打开,在这个过程中,AI的投资也从映射和跟随,变为引领。(周小白)
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- OpenAI劲敌Anthropic再获亚马逊投资 这次仍是40亿美元
- IT战略专家被提名担任LG U+新一任CEO 以加速向AI转型
- 消息称三季度全球AI初创公司融资近120亿美元 全年预计超过600亿美元
- 苹果开发全新Siri:集成先进大模型 叫板ChatGPT
- 消息称马斯克AI初创公司xAI融资50亿美元 估值达到500亿美元
- 阿里整合国内和海外电商,成立电商事业群,蒋凡出任CEO
- 用AI反制AI诈骗,合合信息获全球AI攻防挑战赛金融场景赛道冠军
- 阿里云通义开源大模型获评“2024中国互联网企业创新发展典型案例”
- 超10万开发者已开始赚钱,百度文心智能体平台在乌镇获奖
- 英伟达第三财季营收351亿美元 净利193亿同比增109%
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。