在近日举办的“可信AI·南京人工智能产业发展论坛”上,中国信息通信研究院(中国信通院)正式揭晓了“可信AI”大模型评测结果,快手“快意大模型”(KwaiYii-175B)在其组织的可信AI大模型评测中荣获最高等级——5级评估,这也是国内首个获得“大语言模型专项”5级评估的大语言模型,彰显了其在人工智能领域的技术创新实力与行业领先地位。
「快意」是快手大模型团队自主研发的大语言模型,能够实现高效的自然语言理解和文本生成,为复杂的知识问答、文案创作、实时翻译、逻辑推理,以及代码编写与分析等任务提供强大支持。
自去年 8 月份快手发布自研大语言模型「快意」(KwaiYii)-13B 版本以来,半年内快手又相继研发了 66B、175B 版本的大模型,用以适配不同的业务场景的需求。经过数万亿 Tokens 训练的快意大模型在 MMLU、C-Eval 等中英文权威榜单上均取得了行业领先的成绩,在实际用户体验和反馈中可以看到,快意 175B 的模型效果已显著超越了 ChatGPT-3.5,并达到了接近 GPT-4 的水平。
据介绍,“快意”模型通过硬件优化与混合并行算法的结合,实现了GPU集群算力利用效率超50%的提升,同时将推理成本有效控制在开源方案的十分之一,极大地推动了AI应用的经济性和实用性。
在数据处理层面,“快意”模型成功将PB级别的原始数据精炼为TB级高质量训练集,不仅大幅度降低了数据处理的负担,还通过课程学习式的组织方式,确保了模型训练的高效与平稳。此外,该模型覆盖了广泛的领域知识,进一步强化了其在多元化应用场景中的适应能力。
算法创新是快手此次获奖的关键。据悉,快手与国内外顶尖学术机构携手,共同提出了Temporal Scaling Law理论,为超参数优化提供了新的理论支撑。同时,通过创新集成Scaffold-BPE、MiLe Loss等务实高效的前沿算法,快手在提升模型预训练效率和效果上取得了重大进展。
在对齐技术上,快手采用Rejection Sampling等技术显著改善了数据质量,并通过多样本Packing、Iterative DPO/PPO、细粒度Loss等策略,有效提高了训练的稳定性和模型性能。在解码策略上,提出了创新性的并行解码预测策略,大幅提升了推理速度。
接下来,快手还将在即将召开的2024世界人工智能大会(WAIC)上,举办以“新AI·新应用·新生态”为主题的大模型技术生态论坛。届时,快手将发布最新的大模型技术与应用战略,包括快手大模型技术矩阵全景、基座模型技术创新、应用和落地情况等。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )