撰文 | 李信马
题图 | 百度李彦宏
我们的大模型,是不是太多了?
今天的西丽湖论坛上,百度创始人李彦宏,在演讲中给国内的大模型热潮“泼了冷水”。今年上半年3月,百度才刚发布了第一个国产大模型文心一言,而到了10月末,据报道国产大模型的数量已经达到了238个。
对此,李彦宏评价道:“不断地重复开发基础大模型是对社会资源的极大浪费。”
为什么这么说,难道是先上车的人准备焊死车门吗?让我们冷静思考下,当下,大模型数量的增长速度令人震惊,但这能意味着,我们就有了世界最一流的大模型实力了?显然,数量不是一个有效的衡量指标。谈起大模型,科技圈的第一反应还是 ChatGPT,而238个大模型,绝大多数都是“无名之辈”。
时至今日,我们对大模型的认知也更加清晰,如果将其当成一个聊天工具,或者是单独的产品,那就大错特错了——它的确可以做聊天工具,但最能发挥其价值的定位,是成为类似操作系统一样的技术底座,来支撑海量的应用。
两者的生态位甚至都是对位的,向下是芯片层(大模型会多一个框架层),向上是应用层。如果没有足够的应用,那么大模型能产生的价值,甚至可能都不够其算力的成本。
而对于操作系统,我们就很熟悉了。PC时代,微软的windows一家独大;移动互联网时代,苹果iOS和安卓系统两分天下,华为头破血流才让鸿蒙系统突围而出。这样的竞争,会比我们预想的更残酷,未来就是一场现实版的“大逃杀”或者“吃鸡游戏”,存活的名额可以有几个,但绝不会太多。
如此看来,我们的大模型,真的太多了,多到令人心疼——多少成本、多少人的时间和精力,注定要打水漂啊?
游戏里,从两手空空到赢得游戏的关键,是不停的搜索物资,来帮助在战斗中不断取胜。而大模型的“物资”,就是应用,通过应用,再带来用户和收入,生态才能发展壮大。一部功能机和一部智能手机,硬件价值可能差不多,但智能手机里的几十上百个应用,却是当代人日常生活不可或缺的。
国内大模型当下的问题,是大模型太多,而有价值的AI原生应用太少,就像空荡荡的店铺里没有货物,白白浪费房租(算力)。相比之下,国外的AI原生应用已经有上千个了,目前最接近“现象级应用”这一评价的,就是微软和OpenAI合作的Office365的Copilot,售价高达30美金/月。
不久前,在OpenAI的首届全球开发者大会“OpenAI DevDay”上,GPTs商店横空出世,其产品形态包括分成模式类似于苹果的AppStore,也将大模型对应用的重视提高到了新的高度。“我们知道,人们想要更智能、更个性化、更可定制的AI,可以为你做更多的事情。最终,你只需向计算机说你需要什么,它就会为你完成所有这些任务。”OpenAI首席执行官Sam·Altman描述的未来,就是AI时代的场景。
如果今天,国内大模型创业的模式,还是做一个大模型,然后打榜,融资,提升性能,再找找落地场景,做项目准备上市的话,那这个思路已经落后版本太多了。我们在大模型技术上的落后,其实已经追赶的很接近,百度最新的文心大模型,在中文领域已经追上了GPT-4,当下版本的重心,就是要做应用。
图片来源:百度
全球来看趋势也是如此,AI原生应用进入了爆发的前夜。通过API,AI原生应用调用大模型,将在互联网、制造、能源、电力、化工、交通等行业不断落地,孕育新时代的百度、淘宝、美团、滴滴等。“大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型,专用的小模型反应快,成本低,大模型更智能,可以用来兜底。”李彦宏说。
百度目前在做的,一是“革自己的命”,将所有的应用重做一遍,另一方面,上线了大模型插件平台并对外开放,降低了应用开发和使用的门槛。据统计,在百度智能云千帆大模型平台上,已经有超过17000家企业在开发产业模型和解决方案。
“直到今天,无论是中国也好,美国也好,我认为最好的AI原生应用还有没出现。”做大模型还有没有机会?有,但大模型的机会,并不只是大模型本身,更多的机会将来自其上的应用。AI原生时代,我们需要的是100万量级的AI原生应用,而不是100个所谓的大模型。
以下是李彦宏在西丽湖论坛上的演讲全文。
尊敬的各位领导、各位嘉宾,大家好!很高兴来深圳参加西丽湖论坛。我想借此机会,跟大家分享我对大模型和AI原生应用的一些思考。我演讲的主题是《AI原生时代:“冷”思考和“热”驱动》。现在人工智能很热,但我想首先分享两个“冷”思考。
第一个,中国的大模型很多,但是基于大模型开发出来的AI原生应用却非常少。有报道说,截止10月份国内已经发布了238个大模型,而6月份的时候这个数字是79个,相当于4个月就翻了3倍。但中国有多少AI原生应用呢?我想在座的各位,很少有人能说出一二个来。如果我们看国外,除了有几十个基础大模型之外,实际上,已经有了上千个AI原生应用,这是在中国市场上没有的。而我认为,人类进入AI时代的标志,不是产生很多的大模型,而是产生很多的AI原生应用。为什么这么说?我们看PC时代,基本上只有Windows一个操作系统,但是基于Windows系统开发的软件有很多;移动互联网时代,主流操作系统也只有安卓和iOS两家,而移动应用有800万之多。大模型时代其实也是类似,大模型本身是一个基础底座,类似操作系统,那么最终开发者要依赖为数不多的大模型来开发出各种各样的原生应用。所以,不断地重复开发基础大模型是对社会资源的极大浪费。
AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。如果我们的产业政策能够更加鼓励基于大模型的AI原生应用,我们一定能够构建起一个繁荣的AI生态,推动新一轮的经济增长。
第二个冷思考,由于没有智能涌现能力,专用大模型的价值其实非常有限。我看到一个现象,很多行业、企业,甚至很多城市都在买卡、囤芯片,建立智算中心,想要从头训练自己的专用大模型。殊不知这样炼出来的大模型是没有智能涌现能力的。因为,只有当你的模型的参数规模足够大,训练数据量足够多并且能够不断投入,进行迭代,才能够产生智能涌现,大模型才能具有触类旁通的能力。也就是说,你没教过的东西,它也会了。所以,大模型的产业化模式,应该是把基础模型的通用能力和行业领域的专业知识相结合。也就是大模型套小模型,专用的小模型反应快,成本低,大模型更智能,可以用来兜底。
自从8月31号开放以来,文心大模型的API调用量,呈现了指数级的增长。国内有200多个大模型,上了这个榜单、进了那个排名,但其实调用量是很小的。文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。
刚才说了两个“冷”思考。作为一个在AI领域工作超过十年的从业者,我对大模型和AI原生应用的巨大价值和影响力,都深信不疑。所以我想说一说,AI原生时代的三个“热”驱动。
第一,强大的基础模型,会驱动AI原生应用爆发。中国有领先的基础大模型,这是AI原生应用发展的坚实基础,是底层的能力。3 月16日,百度率先发布了基于文心大模型3.0的文心一言产品,之后快速迭代。
上个月,我们又发布了文心4.0版本,在网站和APP上叫做文心一言专业版。4.0是迄今为止最强大的文心大模型,在理解、生成、逻辑和记忆各方面能力,都有了明显提升。比如,在生成能力上,文心一言除了生成文字内容,还包括图片、视频、数字人等等多模态内容,可实现的创作体裁超过200种,你让他写一首李白风格的诗,写出来就像李白,你让他写一首杜甫风格的诗,写出来就像杜甫,涵盖了几乎所有的写作需求。在逻辑和记忆能力上,相比之前的版本也有了成倍的提升。而AI原生应用,就是基于大模型智能涌现后产生的理解、生成、逻辑和记忆能力而开发出来的应用。这些能力是过去的时代所不具备的,因而才能打开无限的创新空间。作为基础底座,大模型可以支撑无数AI原生应用的开发。但是,直到今天,无论是中国也好,美国也好,我认为最好的AI原生应用还有没出现。就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样,AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。而深圳有着丰富的场景和深厚的产业基础,在AI原生时代深圳一定会再次成为创新创业的沃土。
第二,拥抱AI时代,需要由CEO、一把手来驱动。今天,大模型和生成式人工智能所带来的机遇是堪比工业革命的大机遇,这一点已经成为行业的共识,每一家企业、每一个组织,都在思考如何拥抱这个新时代,如何利用这一新技术来提升自己的竞争力。如同任何新鲜事物都有一个接受过程一样,最早接受的是C端用户和创业企业,之后是中小企业,最后接受的才是大企业,因为大企业天然保守,对新生事物不敏感,不愿意冒风险。我见到很多企业,上上下下都非常重视这次机会,但是对问题的本质理解不深,CEO把这个任务交给IT负责人,IT负责人和工程师天天被那些所谓的“震撼发布”、“史诗级的更新”、“iPhone时刻”、“炸裂”这些说法所忽悠,都想去自己搞个基础模型,或者按照网上传播的评测方法来挑选一款评分高的大模型,大家就以为这就是拥抱AI时代了,殊不知大模型本身不仅不产生任何价值,还造成了对公司资源和社会资源的巨大浪费。
拥抱AI时代,为什么需要一把手来驱动?因为只有CEO才会关心新技术对自己业务的关键指标是不是产生了正面作用。比如对于互联网企业来说,大模型有没有对你的DAU、时长、用户留存这些指标产生正面的影响。其实对于所有企业来说,更简单、更直接的是对你的收入和利润增长有没有产生影响,对你成本的降低有没有产生影响。这才是问题的本质。小公司一把手什么都管,就更容易开发出适合自己的原生应用,大公司分工明确,CEO如果不主动引领这个变革,就很容易被带偏。
在百度我们坚决地对旗下各个产品线进行了AI原生的重构,给大家带来了前所未有的智能体验。比如,新搜索具有极致满足、推荐激发和多轮交互的特点,当用户提出一个问题时,新搜索不再是提供一堆链接,而是通过对内容的理解,生成文字、图片、动态图表等多模态的答案,让用户一步获得满足。再比如,以前准备一场演讲,要耗费好几天时间制作讲稿和PPT,刚刚也讲了,写文章3000字可能一分钟就完成了。现在,百度文库可以在1分钟内生成一个20几页的PPT,包括图表生成,格式美化等,成本几乎是零。新文库也实现了从内容工具到生产力工具的转变。因为有了这样的原生化改造,文库的付费率有了明显的提升,这就是我说的AI对业务关键指标的促进作用。更大想象空间在于,大模型催生出过去从来没有过的AI原生应用。百度也在孵化全新的AI原生应用。比如智能代码助手Comate。今天百度有上万个工程师,百度现在每新增100行代码,就有20行是AI生成的,而且这个比例还在快速增长中。这样的AI原生应用,通过人机协同,帮助我们大幅度提升研发效率。而AI原生应用带来的改变,我认为,才刚刚开始。
第三,繁荣的AI原生应用生态,会驱动经济增长。好的应用会带动市场,倒逼市场变化。类比来看,中国新能源车在全球的市场份额达到65%。这主要是因为国家政策的扶持拉动了应用端,拉动了市场的需求,比如对于新能源车的车辆购置税减免,不限号不限行等等这些手段,都有效拉动了新能源汽车产业的快速增长。AI产业也是需求驱动,所以应该是在需求侧、应用层发力,就像补贴新能源汽车用户一样,鼓励企业调用大模型来开发人工智能原生应用,用市场手段推动产业发展。
我之前说,AI时代的技术栈分为四层,也就是芯片层、框架层、模型层和应用层。无论是芯片也好、框架也好、模型也好,都是需要AI应用来驱动的。只有通过更多的场景落地应用,才可以形成更大的数据飞轮,才能够让芯片做到够用、好用。全球来看,AI原生应用正在成为主要的趋势。微软其实并没有自己的基础大模型,它是跟OpenAI合作的,但是它有最成功的AI原生应用,大家知道就是Office365的Copilot,30美金一个月。百度从做AI的第一天起,就非常重视生态的建设,目前已经拥有了超过800万AI开发者。
不久前,百度上线了大模型插件平台,无论是个人还是企业,都可以通过这个平台,把自己的数据和能力,快速地变成插件。比如法律助手、简历助手、装修助手、旅游、办公等等助手类插件。插件是一类特殊的AI原生应用,不仅容易上手,还能让企业在私有数据没有泄露风险的情况下,更便捷地用到大模型的能力,大大降低了开发者门槛,有利于构建繁荣的AI原生应用生态。
API是AI原生应用调用大模型的主要方式。在制造、能源、电力、化工、交通等实体产业,都将成为大模型和AI原生应用极为重要的落脚点,也将成为推动数实融合的主阵地。今天,在百度智能云千帆大模型平台上,已经有超过17000家企业在这里开发产业模型和解决方案,除了刚才提到的行业,也包括教育、电商、短视频、游戏等多个行业。未来,每一家企业跟自己客户打交道的方式,都会转变为AI原生应用,这将大幅度提升企业的竞争力。无论是企业竞争力的提升,还是个人工作效率的提升,都是经济增长的驱动力。AI应用生态的繁荣就会成就经济繁荣。
“纸上得来终觉浅,绝知此事要躬行”。我讲了这么多大模型和AI原生应用,就是希望每个人都行动起来,去使用它、了解它、体验它、投入到AI原生应用的创新中,共同创造一个百花齐放、无限可能的AI原生时代。
谢谢大家!
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 特斯拉CEO马斯克身家暴涨,稳居全球首富宝座
- 阿里巴巴拟发行 26.5 亿美元和 170 亿人民币债券
- 腾讯音乐Q3持续稳健增长:总收入70.2亿元,付费用户数1.19亿
- 苹果Q4营收949亿美元同比增6%,在华营收微降
- 三星电子Q3营收79万亿韩元,营业利润受一次性成本影响下滑
- 赛力斯已向华为支付23亿,购买引望10%股权
- 格力电器三季度营收同比降超15%,净利润逆势增长
- 合合信息2024年前三季度业绩稳健:营收增长超21%,净利润增长超11%
- 台积电四季度营收有望再攀高峰,预计超260亿美元刷新纪录
- 韩国三星电子决定退出LED业务,市值蒸发超4600亿元
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。