3月11日消息,在国际权威评测平台ANN-Benchmarks离线测试中,零一万物笛卡尔(Descartes)向量数据库登顶 6份数据集评测第一名。
“笛卡尔(Descartes)”是零一万物研发出的基于全导航图的新型向量数据库,是能影响大模型性能表现的基础设施;ANN-Benchmarks是当下业界最权威的向量数据库性能测试工具,它可以展示不同算法在不同真实数据集下的表现。
笛卡尔(Descartes)首次亮相ANN-Benchmarks评测榜单即包揽了六项第一,最高领先原榜单第一名286%。
零一万物表示,笛卡尔向量数据库目前聚焦于高性能向量数据库。笛卡尔向量数据库将用在近期即将正式亮相的AI产品中,未来也将结合工具提供给开发者。
六项第一
ANN-Benchmarks公布的6份评测数据集涵盖glove-25-angular、glove-100-angular、sift-128-euclidean、nytimes-256-angular、fashion-mnist-784-euclidean、gist-960-euclidean六大数据集。
如下图,横坐标代表召回、纵坐标代表QPS(每秒内处理的请求数),曲线位置越偏右上角意味着算法性能越好,零一万物笛卡尔向量数据库在6项数据集评测中都处于最高位。
图注:截至3月10日,ANN-Benchmarks6项评测中,零一万物笛卡尔(Descartes)向量数据库均居第一
“吞吐量 QPS” 是衡量信息检索系统(例如搜索引擎或数据库)查询处理能力的重要指标。在原榜单TOP1基础上,零一万物笛卡尔向量数据库实现了显著性能提升,部分数据集上的性能提升超过2倍以上,在gist-960-euclidean数据集维度更大幅领先榜单原TOP1 286%。
笛卡尔(Descartes)背后技术
向量数据库,又被称为AI时代的信息检索技术,是检索增强生成(Retrieval-Augmented Generation, RAG)内核技术之一。
大模型时代,图片、视频、自然语言等多模态的非结构化数据量陡增,区别于用来处理结构化数据的传统数据库,向量数据库专门用来存储、管理、查询和检索向量化的非结构化数据。
因此,对大模型应用开发者来说,向量数据库是非常重要的基础设施,在一定程度上影响着大模型的性能表现。
未来各家大模型优化到一定程度后,向量数据库的能力可能决定各家大模型的天花板。
此次零一万物笛卡尔向量数据库展示出优异表现,其背后又做了哪些方面的技术创新呢?
和传统检索方法类似,从本质上讲,RAG向量检索主要解决两大问题:
1. 通过建立某种索引结构,减少检索考察的候选集;
2. 降低单个向量计算的复杂度。
据介绍,针对第1个问题,零一万物团队有两大杀手锏:
• 全导航图技术。目前业内现状主要通过哈希、KD-Tree、VP-Tree等方式,导航效果不够精确,裁剪力度不够,零一万物研发的全局多层缩略图导航技术,图上坐标系导航,既能保证精度,又能裁剪大量无关向量。
• 首创自适应邻居选择策略,填补业界空白。零一万物自研的自适应邻居选择策略,突破了以往仅依赖真实topk或固定边选择策略的局限,新策略使每个节点可以根据自身及邻居的分布特征动态地选取最佳邻居边,更快收敛接近目标向量,从而让RAG向量检索性能提高15%-30%。
针对第2个问题,零一万物采用了两级量化方案增强RAG。
零一万物用两级量化降低计算复杂度,同时列式存储充分利用SIMD的并发能力,进一步发挥硬件能力,相比传统PQ查表,性能得到大幅提升到2-3倍。
除此之外,零一万物还有索引结构优化、连通性保障等全栈向量技术方案提高笛卡尔向量数据库的性能。
作为高性能向量数据库,笛卡尔向量数据库可以轻松应对百分之八九十的日常场景,比如帮助企业客户构建私域知识库、智能客服系统;在自动驾驶领域,使用高性能向量数据库可来加速自动驾驶模型训练等。
零一万物表示,笛卡尔向量数据库是团队基于RAG的初步尝试,将在近期发布的AI生产力产品中得到有效应用。零一万物后续会持续专注研发和分享,为用户带来更好的技术和体验。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 苹果警告Meta互操作性请求过多,或威胁用户隐私安全
- 首个智能体安全生态协作组织成立:华为、荣耀、字节、蚂蚁等二十余家头部企业单位加入
- 刚果(金)指控苹果公司涉罪:供应链涉嫌使用“血矿”,法国比利时受理调查
- 我国两大科技企业连续遭受网络攻击,国家互联网应急中心成功侦破
- Netflix因未明确告知客户数据使用情况在荷兰被罚款475万欧元
- OpenAI员工喜迎套现良机:软银集团启动高达16亿美元股票回购计划
- 图森未来正式更名为CreateAI 将开发《金庸群侠传》IP游戏
- 2024年第三季度中国大陆PC市场报告:商用市场面临挑战
- 微软领先科技巨头,成为英伟达Hopper芯片最大买家
- 深圳柔宇显示技术资产二拍即将启动,起拍价下调2.5亿元
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。