4月15日消息,OpenAI发布的了最新GPT-4.1系列大模型,其中在评测函数调用能力时采用了ComplexFuncBench。
ComplexFuncBench是由智谱团队提出的专用于评估大模型复杂函数调用能力的测试基准。
据悉,ComplexFuncBench主要评测大模型在128K的长上下文下进行多步带约束的函数调用的能力。相比于现有函数调用测试基准,ComplexFuncBench要求大模型对真实场景下的用户需求进行细粒度理解,并在此基础上进行多步带推理的函数调用,这对模型的函数调用能力提出了更高的挑战。(果青)
- 猿辅导推教育AI范式小猿AI 聚焦家校应用场景发3款新品
- OpenAl采用智谱标准评测GPT-4.1系列大模型
- 可灵AI基础模型重磅更新 全球用户数已突破2200万
- Tims天好中国2024年总门店规模达1022家 注册会员超2400万
- 猿辅导发布小猿新一代AI学习机 售价5999元起
- OpenAI发布GPT-4.1模型:最强编码能力,仅提供API访问,价格降了
- OpenAI推API组织验证、GitHub突发意外!开源流动理想竟成泡影?
- 国内首个支付MCP来了 AI应用可一键调用支付宝
- 鸿蒙智行发布全民出行安全倡议 呼吁规范使用智驾功能
- 赏花经济迎春“绽放”,中国旅游研究院联合马蜂窝发布《中国赏花游报告2025》
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。