大模型落地,模型只是一部分

4月8日消息,大模型掀起的AI热潮已经涌动了一年多,在国内,2024年被认为是大模型落地元年。

“绝大部分客户在看到大模型的惊艳表现时,下一个问题就是:如何将大模型与我的业务相结合?”亚马逊云科技大中华区产品部总经理陈晓建在谈及生成式AI落地时提道。

“大模型如何有效落地应用”已经成为行业关注的重中之重。

一方面,AGI拥趸者坚守着一个超强模型解决所有的理想,另一方面,更多企业已经务实的开始“具体问题具体分析”的将大模型应用到细分业务场景中。

在大模型落地应用这条路上,亚马逊云科技认为“没有一个模型能够适用于所有场景”,而且,“大模型落地应用,模型本身只是应用落地的一部分”。

近日,亚马逊云科技的中国技术专家也分享了大模型落地的实践经验和思考。一起来看看这这家行业巨头在生成式AI技术落地应用方面的探索。

没有一个模型能够适用于所有场景

“亚马逊云科技与众多客户的合作体会中发现,虽然大模型的能力非常强,但是每个企业的场景千变万化,对大模型的使用必须经历定制化调优和与自身数据结合的过程。如果简单地将大模型拿来原封不动地使用,很可能未必达到最好的效果。“陈晓建表示。

因而,陈晓建称:”我们建议采用循序渐进、从简单到复杂的思路,最初选择一个容易落地且满足业务要求的场景。这个场景从最初的简单到复杂,逐渐了解模型的能力,然后再进行下一步,这样会取得更好的效果。“

我们一直强调,没有一个模型能够适用于所有场景。从实际的例子来看,不同模型擅长的场景和能力实际上各不相同,所以企业需要为自己的场景选择适合的模型。

据介绍,目前Amazon Bedrock上提供多种应对不同场景的模型能力,包括文生图模型Stable Diffusion、Meta的Llama模型、亚马逊自研的Amazon Titan模型、Mistral 7B模型以及Anthropic最新发布的Claude 3的三款模型——具有几乎即时响应能力且最紧凑的 Claude 3 Haiku;在技能与速度之间达到理想平衡的 Claude 3 Sonnet;以及为处理高度复杂任务设计的最智能模型 Claude 3 Opus等等。

“它们的能力、性能和价格都有所不同。客户可以根据需要选择最适合自己业务需求的模型平台。”陈晓建强调。

另外,陈晓建还提到一类客户:有些客户希望生成自己的模型。

“有客户使用亚马逊云科技的底层云资源和算力去做自研模型,而有些客户则选择在Amazon Bedrock上使用已经训练好了的模型结合客户的私有数据进行定制化调整,进行模型微调或预训练。”

谈及大模型应用落地,陈晓建再次强调:“对于客户而言,充分了解业务后选择合适的切入点和模型工具至关重要。”

模型,只是应用的一部分

亚马逊云科技大中华区数据分析与生成式AI产品总监崔玮则进一步认为:“模型仅是客户企业应用的一部分,大模型应用落地必然需要许多组件来实现。”

例如,Amazon Bedrock的Knowledge Bases知识库功能,客户在做企业知识库时,模型可能仅是服务的一部分,还需要利用本地私有数据。

“这也是Claude 3等大模型如此强大,为什么亚马逊云科技在服务客户落地大模型应用时还要加Amazon Bedrock这一层的原因”,陈晓建阐释道:

大模型在企业落地应用这中间有两个重要因素,即模型能力和真正的运营生产之间,需要增加很多辅助能力。

Amazon Bedrock提供一系列除了大模型以外的能力。首先是Provisioned Throughput(预置吞吐量)。第二点,就是模型微调(fine-tunning)能力。还有类似Guardrails的能力,能够全面监管大模型使用情况,通过适当的配置来降低幻觉现象的产生,同时提供全方位日志。

要使用大模型,必须有一定的生产结合。生产结合意味着需要拥有大量的业务数据,需要去与大模型打通。

在这个过程中,客户可以自己做一个 RAG(Retrieval-Augmented Generation检索增强生成) ,需要将客户自己的知识库与大模型做结合。目前,业界通常使用向量数据库等方式,将客户的知识库通过向量的方式存储起来。亚马逊云科技也提供了丰富的向量数据库选择。

大模型非常重要,非常核心,然而仅靠大模型对企业客户的生产是远远不够的。企业需要一系列周边能力帮助实现正确、合理、安全、高效地使用大模型。这就是亚马逊云科技一系列产品所提供的价值所在。

事实上,在去年年底的亚马逊云科技re:Invent大会上,亚马逊云科技在生成式AI领域的三层架构已经正式亮相。

这三层包括:最底层,亚马逊云科技为客户提供基础算力,包括Nvidia最新推出的G200芯片、自研芯片Amazon Trainium 和 Amazon Inferentia等。

中间层,也就是随着生成式AI出来的一些全新的产品,例如Amazon Bedrock,通过一个模型平台支持多种技术大模型。

上层与大模型应用结合,例如推出的Amazon Q,并与BI应用Amazon QuickSight、智能客服的产品Amazon Connect、编程平台Amazon CodeWhisperer等有效结合,支持不同客户的业务需求。

通过这三层,亚马逊云科技希望给不同的客户需求提供不同层级的产品来支持客户的业务。

陈晓建最后也强调:“即使有最完善的数据基础、可以选择最好的工具,但是每个客户的场景依然是千变万化的。为了能将最新的云的生产力与业务相结合,企业需要专业的团队来做业务支持。在生成式AI时代,我们依然会通过专业团队为各行业用户的生成式AI应用保驾护航。”

极客网企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2024-04-08
大模型落地,模型只是一部分
4月8日消息,大模型掀起的AI热潮已经涌动了一年多,在国内,2024年被认为是大模型落地元年。“绝大部分客户在看到大模型的惊艳表现时,下一个问题就是:如何将大模型与我的业务相结合?”亚马逊云科技大中华区产品部总经理陈晓建在

长按扫码 阅读全文