Create 2024百度AI开发者大会,李彦宏发布文心大模型4.0工具版

“未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”

4月16日,Create 2024百度AI开发者大会在深圳举办。百度创始人、董事长兼首席执行官李彦宏发表了题为《人人都是开发者》的主旨演讲。他认为,大模型和生成式AI将彻底改变开发者这个群体。

AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”

百度已经为开发者们准备好了三大“开箱即用”的工具,包括智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder。“这三个工具,都代表了先进生产力。”

值得一提的是,李彦宏现场分享了百度在开发AI原生应用上的具体思路,并表示:“这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”这三个开发AI原生应用的思路分别是,MoE、小模型和智能体。

会上,李彦宏正式发布了文心大模型4.0的工具版。他还透露,截至目前文心一言用户数已经突破2亿。“文心大模型已成为中国最领先、应用最广泛的AI基础模型。”

得益于文心大模型的强大,开发者通过文心4.0降维裁剪出来的更小尺寸模型,要比直接拿开源模型调出来的模型,同等尺寸下效果明显更好;同等效果下,成本明显更低。“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”

以下为李彦宏的主要观点:

自然语言将成为新的通用编程语言,只要会说话就可以成为一名开发者

“大模型和生成式AI,将彻底改变开发者这个群体。过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,你只要会说话,就可以成为一名开发者,用自己的创造力改变世界。”

“上岗一年多,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。”

“今天,你不会写代码,也可以做出一个AI应用;不用编程,也可以做出一个智能体。AI正在掀起一场创造力革命,未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”

AgentBuilder、AppBuilder、ModelBuilder,都代表了先进生产力

“作为一家技术公司,百度的角色定位,就是尽可能地为大家提供所需的开发工具,不断提升整个社会的创造力。”

“具体来说,我们提供1个强大的基础模型系列,就是文心大模型系列,这包括旗舰版的ERNIE3.5, ERNIE4.0, 也包括轻量版的ERNIE Speed、Lite、Tiny等等。”

“我们还提供基于大模型来开发各种应用的工具,包括智能体开发工具AgentBuilder,AI原生应用开发工具AppBuilder,以及各种尺寸的模型定制工具ModelBuilder。这三个工具,都代表了先进生产力。”

文心一言用户数突破2亿,文心大模型4.0工具版正式发布

“文心一言从去年3月16日发布,到今天是一年零一个月的时间。我们的用户数突破了2亿,API日均调用量也突破了2亿,服务客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。”

“近几个月来,文心大模型在代码生成、代码解释、代码优化等通用能力方面实现了进一步的显著提升,达到国际领先水平。今天,我们正式发布文心大模型4.0的工具版。”

“文心大模型已经成为了中国最领先、应用最广泛的AI基础模型。”

“相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本现在一天可以调用100万次。”

开发AI原生应用的具体思路,是过去一年踩了无数坑、交了高昂学费换来的

“大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”

“今天我想跟大家分享的是一些基于大模型开发AI原生应用的具体思路和工具。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。”

“第一是MoE。未来大型的AI原生应用基本都是MoE架构,这里所说的MoE不是一般的学术概念,而是大小模型的混用,不依赖一个模型来解决所有问题。”

“第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过SFT精调后的小模型,它的使用效果可以媲美大模型。这就是我们发布Speed,Lite、Tiny三个轻量模型的原因。我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型,效果更好,速度更快,成本更低。”

“第三是智能体。智能体是当下很热的一个话题,随着智能体能力的提升,会不断催生出大量新的应用。智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,我们还可以让不同的智能体互动,相互协作,更高质量地完成任务。”

智能体是未来离每个人最近、最主流的大模型使用方式

“智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。”

“百度刚刚升级了文心智能体平台。截至目前,已经有3万多个智能体被创建、5万多名开发者和上万家企业入驻。我们的目标是,让每个人、每个组织都成为智能体的开发者,打造国内最完整的智能体生态。那如何实现这个目标呢?就是给大家提供零门槛的智能体开发工具AgentBuilder。”

“今天,每一个商家、每一个客户,都能在百度拥有专属的智能体。整个过程完全不需要编程,通过类似提示词的信息输入,和简单的几步操作调优,就能迅速生成一个智能体,成为7X24小时在线的金牌业务员。”

现场,李彦宏演示了新加坡旅游局、启德教育和索菲亚三个智能体案例,手把手教开发者用自然语言,5分钟、零门槛创建一个智能体。

“启德教育智能体非常的受欢迎,上线第一周,就成功分发了155万次,与用户交互了5.8万次,线索转化量直线增长、有效线索的转化成本明显降低,经营效率大幅提升。”

“索菲亚商家智能体上线以来,有效线索成本下降了30%。也就是说,它获得一个有效客户,如果过去的成本是100块,现在只需要70块了。

AppBuilder:最好用的AI原生应用开发工具,用自然语言三步就能开发一个应用

“AppBuilder,它是目前最好用的AI原生应用开发工具。在AppBuilder上面,我们提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。”

“最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。”

现场,通过“游乐场排队助手”、华北电力大学“华电AI助理”和百度文库智能漫画生成三个案例,李彦宏展示了一个AI原生应用的创建过程。只需名称设定、填写角色指令、插入组件简单三步,即可创建一个AI原生应用。

他还指出,AppBuilder拥有两大优势:

“一是功能强大。依托文心4.0对指令的理解和遵循能力,我们的AppBuilder,能保证冷启动就能达到一个不错的水平,不会因为效果差,再花很长时间去调优,大大降低了开发门槛。依托检索增强技术RAG,在知识问答等典型场景,我们的问答准确率和友好回复程度都达到了95%以上,大幅超越其他同类产品。”

“AppBuilder还提供丰富完整的组件工具,包括百度搜索等基于百度多年技术积累的AI能力组件、大模型能力组件,还有百度独家开放的业务组件等55个组件。以及一些主流场景的第三方API,比如航班查询、论文查询等。我们还刚刚支持了自定义组件,客户可以直接对接自己专有的任何工具和数据。这些丰富的组件,共同支撑起了AI原生应用的高效开发。”

“二是简单易用。使用AppBuilder,只需三步即可快速创建应用、一键分发。我们也支持开源的SDK,方便大家进行二次开发。”

各种尺寸的模型定制工具ModelBuilder:高效低价生产模型

“更适合专业开发者使用的工具,那就是ModelBuilder,它可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调SFT,这样就能达到更好的效果。”

现场,李彦宏展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。

他还在现场与小度实时互动,展示小度用MoE多个模型组合的方式来执行不同任务,例如使用小模型ERNIE Tiny执行模型路由工作,而性能最好的文心4.0则用来执行日程安排等复杂需求。据介绍,相比全部使用文心大模型的旗舰版,小度可以实现响应速度提升2倍,成本下降99%。

李彦宏表示,“这几个关于ModelBuilder的例子,展示的是百度高效低价生产模型的能力”。

“为了方便大家快速上手,ModelBuilder预置了最全面最丰富的大模型。包括了ERNIE3.5和ERNIE4.0,这是旗舰版的大模型,它适合通用的复杂场景,能力强大;还有三个轻量级的大模型,ERNIE Speed、Lite、Tiny;另外还有两个垂直场景的模型,ERNIE Character适合角色扮演;ERNIE Functions适合对话或问答场景中的外部工具使用和业务函数调用。当然ModelBuilder也支持国内外第三方主流模型,总数量达到77个,是国内拥有大模型数量最多的开发平台。”

开源模型会越来越落后

“因为有了最强大的基础模型文心4.0,我们可以根据需要,兼顾效果、响应速度,推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和post pretrain。”

“这样通过降维裁剪出来的模型,比直接拿开源模型调出来的模型,同等尺寸下效果明显更好,同等效果下,成本明显更低。”

“大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。”

多模态大模型是通往AGI的必经之路,视觉大模型最大的应用场景是自动驾驶

“面向未来,我认为多模态大模型,或者说文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往AGI的必经之路。百度在这些领域有着长期投入,并将及时更新大模型的最新进展。”

“我有一个非常不一样的判断:视觉大模型最大的应用场景是自动驾驶。百度在这个方向上是最好的,是自动驾驶的全球领导者,我们不只训练AI如何生成视频,更训练AI理解真实世界发生的事情并预测未来。”

“基于超过1亿公里的、中国复杂城市道路测试里程数据,百度训练出来了Apollo视觉感知大模型。它具备检测、跟踪、理解、建图四大基础能力。这让百度拥有了更智能、适应性更强、更安全的自动驾驶方案。”

人人都可以成为开发者,未来,必将是一个由开发者一起创造出来的未来

“今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工智能+’行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。”

“人人都可以成为开发者,而未来,也必将是一个由开发者一起创造出来的未来!”

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与极客网无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-04-16
Create 2024百度AI开发者大会,李彦宏发布文心大模型4.0工具版
Create2024百度AI开发者大会,李彦宏发布文心大模型4.0工具版

长按扫码 阅读全文