Zilliz携手大模型生态企业玩转GDC 2024,向量数据库和RAG成行业焦点

3 月 23 日-24 日,聚焦全球开发者精英,由上海市人工智能行业协会(SAIA)主办的 2024 全球开发者先锋大会(2024 GDC)在上海举办。Zilliz 作为向量数据库赛道的领军者,受邀参与了此次活动,不仅在不同形式的活动中进行了 3 场主题分享,还与百川智能、Dify.AI、Moonshot AI 等公司一同在「大模型展示及研讨专区」的产品互动展台,与来自各地的开发者进行互动。

据悉,本次大会由世界人工智能大会组委会、上海市经济和信息化委员会、上海市徐汇区人民政府、中国(上海)自由贸易试验区临港新片区管理委员会共同指导,上海市人工智能行业协会联合上海人工智能实验室、上海临港经济发展(集团)有限公司、开放原子开源基金会共同主办。

全球开发者先锋大会(GDC)缘起总.理在达沃斯世界经济论坛打 CALL 的世界人工智能大会(WAIC),作为 WAIC 聚焦科技和人才力量的重要板块,GDC 已发展成为全球开发者的盛大节日、顶尖技术趋势的风向标。向量数据库赛道正是 AIGC 时代的重要技术风向标,Zilliz 在现场向全球的开发者展示了其在顶尖向量数据库技术的多重探索。

Zilliz 资深解决方案架构师沈亮以《百亿级向量数据库架构创新与优化之路》的主题进行了分享。他表示,向量数据库最早诞生于 2019 年,由 Zilliz 公司推出并开源了全球首款向量数据库 Milvus。在那个时期,向量数据库的功能相对比较简单,主要是基于向量检索库 Faiss 的基础上,封装了远程过程调用(RPC)接口,并支持了基于 Write-Ahead Logging(WAL)的持久化能力。相比于传统的向量检索方法,Milvus 1.0 的最大意义在于解耦了业务逻辑、模型和数据存储这三者之间的紧密关联。这意味着应用开发者不再需要关注底层基础设施的维护工作,这些工作包括但不限于集群的部署、数据的持久化和数据的迁移等。因此,Milvus 1.0 为许多用户提供了从传统烟囱式的人工智能开发模式向大模型时代。

随着大模型技术的蓬勃发展,向量数据库开始进入 2.0 时代,更多的个人开发者涌入赛道,对向量数据库的关注也逐渐迁移到开发效率、部署简单以及面向大模型加强场景的功能需求。向量数据库绝不仅仅是用来进行简单的向量检索,要想真正提升开发者的开发效率和使用成本,需要系统开发者深入理解硬件、存储、数据库、AI、高性能计算、分布式系统、编译原理、云原生等,以确保其稳定性、性能和易用性。在此基础上,Zilliz 推出了Zilliz Cloud,可提供全托管的 SaaS 及 BYOC 向量数据库服务,具备深度优化、开箱即用的 Milvus 体验。使用 Zilliz Cloud 可以轻松构建百亿级向量数据库,分钟级部署和扩展向量搜索服务,并由全球最专业的向量数据库团队提供运维、优化、及综合支持。

Zilliz 开发者生态及市场运营负责人 Jerry 首先进行了主题为《走进向量数据库和 RAG ——让 LLMs 停止幻觉》的分享。Jerry 表示,过去一年,RAG 在技术层面发展迅速,为向量数据库赛道添了一把火。RAG 和向量数据库的结合,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。

具体来看,大模型的局限性包括:其一,缺乏领域特定信息:LLM 仅基于公开数据集训练;缺乏领域特定信息或专有信息等非公开数据。其二,容易产生幻觉:LLM 只能根据其现有数据提供信息和答案;如果超过该范围,LLM 会提供错误或捏造的信息。其三,无法获取最新信息:LLM 训练成本十分高昂,无法及时更新其知识库。其四,不变的预训练数据:LLM 使用的预训练数据可能包含过时或不正确的信息,且这些数据无法更正或删除。

向量数据库可有效针对解决上述问题,例如针对缺乏领域特定信息的问题,可利用向量数据库建立知识库,拓展认知边界;针对无法获取最新信息的问题,可以利用向量数据库为大模型建立记忆、及时更新。

在此基础上,RAG 技术栈应运而生,通过 LLM、向量数据库和提示词的相互配合,让 LLM 停止幻觉。此外,Jerry 还介绍了向量数据库的其他应用场景,包括图片搜索、视频搜索、文本搜索、数据去重、跨模态搜索、推荐系统、问答系统、版权保护、网络安全、AI 制药等。

在《2024 年,重新再来说说关于向量数据库的那些事儿》主题分享中,Jerry 回顾了向量数据库从小众赛道到爆火的全过程,并提及了外界对于向量数据库和 RAG 的疑问。他表示,大模型技术正在改变世界,但无法改变世界的运行规律。对于大模型而言,长期记忆的重要性也将持续存在。AI 应用的开发者一直在追求查询质量和成本之间的完美平衡。当大型企业将生成式人工智能投入生产时,需要在控制成本的同时保持最佳的响应质量。在此情况下,RAG 技术和向量数据库依然是实现这一目标的重要工具。

最后,Jerry 提到,Zilliz 最近面向 AI 初创企业推出了一项扶持计划,预计提供总计 1000 万元的 Zilliz Cloud 抵扣金,致力于帮助 AI 开发者构建高效的非结构化数据管理系统,助力打造高质量 AI 服务与运用,加速产业落地。届时将为全球的 AI 初创团队提供资源、技术、市场推广、销售等全方位的支持,符合要求的团队可获得独家资源与支持。欢迎各位开发者访问 Zilliz 中文官网首页点击 Zilliz AI 初创计划,与 Zilliz 一起共建 AI 生态!

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )