7月5日消息,蚂蚁集团联合清华大学发布大模型安全一体化解决方案“蚁天鉴”2.0版。
据了解,蚁天鉴去年7月首次对外发布,历时1年升级到2.0版。2024年,蚁天鉴商业化迈出重要一步,通过蚂蚁数科开始服务广泛的外部客户。
作为蚂蚁集团科技商业化的重要板块,蚂蚁数科自今年3月份独立化运营以来,悄然推进AItoB战略,SOFAStack、蚁盾等多个代表性产品均发布了大模型相关服务。
从WAIC现场了解,蚁天鉴2.0形成了包括大模型基础设施测评、大模型X光测评、应用安全测评、AIGC滥用检测、证件伪造检测、围栏防御等在内的完整技术链条,面向行业提供全方位智能化的大模型安全测评和防御解决方案。
在测评端,蚁天鉴2.0研发了业内首个“测评智能体”。该测评智能体提供全流程自动化的安全测评工具,支持各种形式模型和深度学习框架,可扩展测评垂类大模型、多模态大模型及Agent智能体,并能根据被测大模型的安全水位动态调整攻击策略和出具测试用例,保障测评效果和效率。
现场工作人员表示,目前,蚁天鉴2.0有超300万高质量测评题库,支持最高50万/日的饱和式攻击和逐级诱导深度攻击,并实现了1工作日内完成测评,全流程自动化率>99%。
此外,该智能体增加了两项新功能。一是大模型X-ray,即大模型X光,可针对大模型的内在神经元进行X光扫描来做探查和判断,让研究人员了解大模型内部在发生什么、定位可能引发风险的神经元、并进行编辑修正,从而在模型内部治理幻觉,实现从源头识别和抑制风险。二是大模型基础设施测评。此前蚁天鉴的测评能力主要集中于大模型生成的内容安全、合规风险等检测。蚁天鉴2.0从攻击者全链路视角出发,深入扫描模型算法组件及软件系统,可及时准确发现大模型供应链及运行环境安全问题,保障云到端的应用安全可控。
同时,蚁天鉴2.0防御端新增“AI鉴真”功能。支持多模态内容真实性及深度伪造检测,可快速精准鉴别图像、视频、音频、文本内容的真伪,图像识别准确率99.9%达到行业最高优秀级(信通院测评)。目前,蚁天鉴2.0依托生成模型自建百万量级音视图多模态合成数据集,覆盖主流生成方案,有效应对AI换脸、声音模拟、证件伪造等各类深度伪造风险场景。(周小白)
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- TechWeb一周热点汇总:双11全网交易总额超1.4万亿元,马斯克升级与OpenAI的法律战
- 阿里巴巴2025第二财季营收2365亿元 同比增长5%
- 2024广州车展:长安凯程品牌战略焕新,数智新能源商用车成焦点
- 2024广州车展:长城汽车全场景NOA全国开城
- 京东辟谣:无锡物流园失火仓库属存货仓库,无一部手机和任何快递包裹
- TechWeb微晚报:特斯拉市值已跌破1万亿美元,上海颁发首批无人驾驶车牌
- 宁德时代携手上海交大布局机器人领域,自研人形及四足机器人助力工厂智能化
- 以科技创新赋能高教职教新质人才培养 华为擎云亮相第62届中国高等教育博览会
- 郑州共享单车服务暂停,美团哈啰相继宣布停运
- 华为余承东广州车展透露Mate 70即将发布,担心新机遭偷拍
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。