原标题:频频破圈,走向百业:大模型的毕业季
人间六月,满眼芳菲。很多人将在这时迎来人生中又一个毕业季。与熟悉的课堂、校舍、同学道别,走向新的学府,或者走向自己选择的行业。
这个情感浓烈的六月,却与往昔有点不同。除了人类的青春故事依旧精彩,AI大模型也在毕业季频频出圈。最近,百度的数字人度晓晓,向我们完美展示了一枚AI同学如何度过一个完美六月。先是写高考作文,后是画作参加美院毕业展,紧接着还跟龚俊一起创作音乐。难怪很多同学表示,我的毕业季可没有AI那么精彩……
支撑度晓晓实力破圈的,是百度自主研发的文心大模型。
几年以来,大模型可以说是AI领域,乃至整个科技界的核心热词之一。我们经常会听到某公司/科研机构训练了新的大模型,参数规模打破了记录;却很少听到某行业/领域真的用到了大模型。从2018年十月谷歌AI发布bert开始算起,大模型到这个六月正好度过了“大学四年”。换言之,这项被赋予期望的技术,也该迎接自己的毕业季了。
此前,我们看到的是大模型无尽的提升训练模型参数,无尽的刷新数据集测试分数,并且有各种各样新的技术思路加入大模型训练。但面向未来,我们可能只需要以一种思路来评判大模型:能不能带来产业价值。
度晓晓的出圈,确实刷新了很多人对AI的认识。但更重要的是它通过一系列动作,向产业证明了预训练大模型如何跨越技术屏障,真正与产业结合,向开发者与千行百业开放生态。
2019年,百度率先发布了中国首个正式开放的预训练模型ERNIE1.0,开启了中国大模型的“入校生涯”;2022年,文心大模型第一个冲出实验室、数据集的大门,引领了全球大模型的“产业岁月”。
能够做到这一切的原因,在于文心大模型正确回答了三道“毕业考试题”。
先答这道“证明题”:一系列出圈动作背后的技术跨越
短短几天之内,百度数字人度晓晓首先挑战高考作文。参与作答了全国新高考Ⅰ卷的《本手、妙手、俗手》议论文写作,40秒就根据题目创作了40多篇文章,平均1秒生成1篇,随机抽取其中一篇,分数已赶超约75%高考考生。
紧接着,度晓晓带着她的画作参加了西安美术学院2022年“时空留痕·无界西美”本科毕业展,开设了自己的专属展区。她平均只需数十秒就能完成一幅有意味,充满鲜明艺术特质的画作,被美院老师评为已经具有毕业生水平。
这两件事当然让AI数字人实力出圈。而在行业内人士看来,这两件事的核心意义在于,文心大模型做了两道难度非常高的技术证明题,展示了大模型不是只能纸上谈兵,而是能够应对真正的产业场景。
在以往的大模型测试中,所使用的基本是内容固定、方向单一的数据集。这种测试当然有一定价值,但却与产业中需求多样、数据样本稀少、用时要求苛刻的环境有天壤之别。
比如说高考作文写作就是这样一个任务。高考作文比一般的文本生成任务更长,而且需要保证长文各个段落之间的逻辑性和连贯性。与此同时,写作需要彻底理解并且紧扣主题,从而保证中心突出,确保所有信息准确指向踩分点。这种真正考人,而不是考AI的任务,就是对大模型的一个巨大挑战。在AI写作高考作文中顺利完成任务的,是百度使用了最新推出的文心·NLP大模型 ERNIE 3.0 Zeus。它就像个见多识广的“尖子生”“学霸”,理解能力和创作能力比传统模型更强。最终展现在我们面前的,就是一篇文辞华美、立意准确的高考作文。
再说说参加毕业画展。我们知道,大模型的特征之一就是不仅能够处理自然语言处理任务,还在机器视觉、跨模态、知识图谱等领域取得了巨大进展。度晓晓在美院画展上创作的“无界”系列画作,从不同角度诠释了AI理解的“无界”,就展现出了文心大模型跨模态图文生成模型ERNIE-ViLG,所具备的强大跨模态理解和生成能力。
跨模态理解信息,生成内容,是人类智力的专属价值,也是AI的核心努力方向。根据题目创作画作,需要AI对给到的信息进行深度理解,紧接着结合自身联接的知识进行信息拓展,进而阐述创作的灵感,最终再以跨模态生成的方式完成画作。文心大模型的这一系列操作行云流水,而且真正做到了信息准确与艺术表现力的统一。这种智商与情商兼具的艺术家,其实才是最难得的。
这两件出圈之举,可以说是文心大模型回答的证明题:向业界证明了AI大模型不仅能够堆参数,跑数据集。还能够无差别参加那些只有人类才能参加的活动,并且给出不属于人类的完成水准。我们已经不需要谨小慎微地给大模型出题了,广阔天地,四海八方,或许都是AI可以参与一答的题目。
当然,写作文与作画背后,不仅是文心大模型的技术能力自证,同时也是AIGC产业方向的清晰标识。能够写文作画的AI,当然也可以在更多内容生产中大展身手。比如AI写歌、AI剪辑等等。
于是,刚刚放下答题纸和画笔的文心大模型,就跑去写了首歌,顺道组了个CP。
再来看看“多选题”:和龚俊组CP展示出的应用价值
毕业季中,走向社会的年轻人不仅需要证明自己的能力,还需要选择清楚自己的道路——大模型当然也是如此。
于是我们看到,大模型正在越来越多的岗位发光发热,并且还是与明星一起。6月14日,度晓晓与龚俊数字人联合演唱的《每分 每秒 每天》歌曲MV成功刷屏。这是国内首支从作词到编曲都是由AI来完成的虚拟偶像单曲。
此外,度晓晓与龚俊数字人已经入驻百度APP。在用户使用百度APP的时候,可以通过搜索框或者底部的语音按钮发起聊天类需求。比如用户说“你好,你多大了,我想你了,我想聊天”,会直接进入搜索负一楼的对话式框架。度晓晓&龚俊数字人会在负一楼陪伴用户,进行具有深度的语音对话。
为了这份随时随地的陪伴,文心大模型提供了整合了多模态交互技术、机器翻译、语音识别、自然语言理解等多项能力,从而实现了个性化聊天陪伴、辅助搜索、服务分发和互动玩法四大功能为一体。在百度APP中,用户可以直接通过个性化聊天来感受大模型的能力和魅力。文心大模型可以呈现出有上下文联系,自然生动的聊天互动,并且在对话中识别用户是否有搜索需求、服务类需求等进行辅助。而这背后,是全球首个生成式开放域对话大模型PLATO。
PLATO当然有着一系列技术差异性,但或许更重要的是,它清晰展示出了预训练大模型如何与具体的应用场景、实际应用任务相结合。大模型的价值清晰展现在了对以往APP交互的超越上,通过开放域对话大模型,APP可以向用户提供超越以往搜索服务与语音助手服务的全新价值。其体验更加接近与真人互动,并且比传统的关键字搜索会更加人性化、更有针对性,能够更加准确理解用户的需求。
大模型的应用价值,不在于能够替代此前的某种技术。或者说不仅于此,而是可以做出“多选题”,集成多样化的价值,应用于多样化的产业需求。
在数字人生成、智能客服、AIGC等等领域,可以看到文心大模型都有着真实且广泛的产业级应用落地。
一起来做这道“开放题”:大模型刚刚毕业,却已经走向百业
也许那边的朋友要问了:这么好的大模型,什么时候才能体验到呢?答案是,现在。
文心大模型已经是一道开放题,等待着千行百业的你来一起写画她的毕业作品。
举个例子,上文提到的ERNIE 3.0 Zeus是文心大模型最新发布的融合任务相关知识的千亿大模型,也是国内首个开放API调用的千亿大模型。该模型在学习海量数据和知识的基础上,进一步学习百余种不同形式的任务知识,增强了模型的效果,在各类NLP任务上表现出了更强的零样本和小样本学习能力。而ERNIE 3.0 Zeus的智能写作功能目前已经上线旸谷社区,开发者可以即可体验到这些前沿技术带来的价值。
既很强,也很落地,或许可以被称为文心大模型的毕业季口号。这背后是文心大模型的两大核心特色:产业级和知识增强。
“知识增强”是文心大模型的核心技术差异,即通过引入知识图谱,通过“知识增强”的方法,将数据与知识融合,使得文心大模型相较于其他模型,学习效率更高、可解释性更好。这是文心大模型能够超越众多“同学”,率先走向就业的技术保障。
而“产业级”则是百度在大模型落地领域的经验、技术、产品设计与生态培养等等能力的融合。一方面,文心大模型的技术来源于产业,从设计与技术上就倾向产业应用;另一方面,文心大模型建设了一系列配套能力和工具,通过多种方式降低大模型应用门槛,提升其真实应用的可行性。
在这两大特性的保证下,百度在全球范围内开启了一场让大模型走向产业的“毕业旅行”。写高考作文,画毕业作品,与明星一同写歌,都可以看作这场旅行中的一些风景。在更广阔的产业原野上,百度还将文心大模型不断升级,瞄准各行业的智能化需求。不久之前的WAVE SUMMIT 2022深度学习开发者峰会上,文心大模型迎来一系列升级:发布10个新的大模型,同时提出了基础大模型、任务大模型、行业大模型构成的三级体系。让不同的应用场景、行业需求有不同的大模型支撑,真正让大模型走向千行百业。与此同时,考虑到开发者、应用者不同的使用需求和开发能力,百度还围绕文心大模型提出了一系列产业落地的关键路径,比如建设更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态等。为促进大模型惠及最广泛的行业与开发者,配套发布大模型套件、API体系,以及旸谷大模型创意社区,全方位帮助开发者更低门槛地应用。
如今,智能作画、智能对话、智能创作、故事生成等大模型创意应用已经上线旸谷社区。百度与国家电网、浦发银行等行业头部企业进行了联合研发与创新,成功实现了行业大模型在产业中落地生根。
从应用深度上看,在百度内部文心大模型也全面应用于智能搜索、信息流、智能音箱等互联网产品,大幅提升了用户获取信息、知识和服务的效率和体验。在百度之外,文心大模型的落地应用已经覆盖工业、能源、教育、金融、通信、媒体等众多行业,例如工业领域的零部件质量检测、能源领域的输电线路巡检、金融行业的合同信息抽取等等,帮助企业实现智能化升级。
百度业务中看得到,产业应用里用得到,开发者找得到,让文心大模型做成了一道开放题。它的答案,是人人都能成为大模型开发者,行行都能成为大模型应用者。
《经济学人》最近发了一篇关于大模型的文章,其中提到文心ERNIE大模型是中国最好的预训练大模型。就我的理解,文心大模型好就好在它的“真”。
真实的解决技术难题,而不是用多少亿的参数,百分之九十九点多少的分数来证明自己。
真诚不套路的去用,去证明自己的价值。而不是画饼充饥,用PPT展示未来。
真正地融入产业,融入需求,赋能开发,筑造生态。
或许,每个人在校园里都许下过改变世界的梦想。后来有人真正实现了,有人没有。
差别可能就在于毕业季到来的那天,我们选了什么,做了什么。
致用,务实,本分,这才是大模型的花样毕业季。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 美媒聚焦比亚迪“副业”:电子代工助力苹果,下个大计划瞄准AI机器人
- 微信零钱通新政策:银行卡转入资金提现免手续费引热议
- 消息称塔塔集团将收购和硕印度iPhone代工厂60%股份 并接管日常运营
- 苹果揭秘自研芯片成功之道:领先技术与深度整合是关键
- 英伟达新一代Blackwell GPU面临过热挑战,交付延期引发市场关注
- 马斯克能否成为 AI 部部长?硅谷与白宫的联系日益紧密
- 余承东:Mate70将在26号发布,意外泄露引发关注
- 无人机“黑科技”亮相航展:全球首台低空重力测量系统引关注
- 赛力斯发布声明:未与任何伙伴联合开展人形机器人合作
- 赛力斯触及涨停,汽车整车股盘初强势拉升
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。