快手自研大模型「快意」亮相 在多个大模型榜单上表现优异

据报道,快手正式加入大模型赛道,其自研大模型「快意」(KwaiYii)已经开启内测,并为业务团队提供了标准API和定制化项目合作方案。目前,「快意」在多个知名大模型排行榜上表现强劲,在CMMLU中文向排名第一,引发了广泛关注。

KwaiYii-13B在CMMLU中文向排名第一

根据其GitHub主页介绍,「快意」是由快手AI团队从零到一独立自研的大规模语言模型,而本次引发关注的正是其新版本KwaiYii-13B。该模型在多个Benchmark上都处于领先水平,证明了其在自然语言处理任务中的出色性能。

其中,KwaiYi-13B-Base预训练模型具备优异的通用技术底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平,显示了快意大模型在中文和英文上都具备非常强悍的能力。

KwaiYii-13B-Base在Benchmark上的效果(来源:快意GitHub主页)

而KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYi-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。

KwaiYii-13B-Chat在人工评测上的效果(来源:快意GitHub主页)

据悉,目前「快意」已经开启内测,并为业务团队提供了标准API和定制化项目合作方案,以便在各种业务场景中进行测试和验证。

正在内测的「快意」对话平台

一直以来,快手AI团队都在专业领域有着出色的表现,研究成果频繁出现在国际顶级会议和期刊上,也多次在全球性比赛中获奖。2022年至今,快手AI团队已发表130多篇顶会论文,覆盖机器学习、自然语言处理、图像识别、语音识别、搜推广等多项研究领域,包含 ICCV/CVPR (21), ACM MM (9) , KDD (9), SIGIR (9) 等顶级会议。

此前,已有消息表明快手在大模型落地方面进展迅速。7 月 8 日,快手宣布正在内测智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。8 月 8 日,「快手 AI 对话」开启测试,以搜索场景为入口,为用户提供更多元、便捷的搜索形态,大为降低用户的搜索使用门槛,让新技术带来的便利惠及更广泛的人群。据悉,这两个新产品功能均基于「快意」大模型研发。

8 月 18 日,「快手 AI 对话」 功能已经在快手 APP 安卓版本开放内测,这也是短视频直播行业首个基于大语言模型落地的智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。参与测试的用户点击快手搜索首页右上角AI图标即可进入产品首页,选择输入内容对话或点击引导问题便可开启对话,或者触发「搜索智能问答」卡片,通过底部入口可以启用该功能。

快手App已内测AI对话功能

据称,快手AI团队将持续迭代「快意」大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多C端与B端业务场景下的落地 。可以预见,随着如「快意」等大模型的不断发展,AI的应用边界将得到进一步的拓宽,将能为用户带来更丰富的产品体验和更高效的服务。

据报道,快手正式加入大模型赛道,其自研大模型「快意」(KwaiYii)已经开启内测,并为业务团队提供了标准API和定制化项目合作方案。目前,「快意」在多个知名大模型排行榜上表现强劲,在CMMLU中文向排名第一,引发了广泛关注。

KwaiYii-13B在CMMLU中文向排名第一

根据其GitHub主页介绍,「快意」是由快手AI团队从零到一独立自研的大规模语言模型,而本次引发关注的正是其新版本KwaiYii-13B。该模型在多个Benchmark上都处于领先水平,证明了其在自然语言处理任务中的出色性能。

其中,KwaiYi-13B-Base预训练模型具备优异的通用技术底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平,显示了快意大模型在中文和英文上都具备非常强悍的能力。

KwaiYii-13B-Base在Benchmark上的效果(来源:快意GitHub主页)

而KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYi-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。

KwaiYii-13B-Chat在人工评测上的效果(来源:快意GitHub主页)

据悉,目前「快意」已经开启内测,并为业务团队提供了标准API和定制化项目合作方案,以便在各种业务场景中进行测试和验证。

正在内测的「快意」对话平台

一直以来,快手AI团队都在专业领域有着出色的表现,研究成果频繁出现在国际顶级会议和期刊上,也多次在全球性比赛中获奖。2022年至今,快手AI团队已发表130多篇顶会论文,覆盖机器学习、自然语言处理、图像识别、语音识别、搜推广等多项研究领域,包含 ICCV/CVPR (21), ACM MM (9) , KDD (9), SIGIR (9) 等顶级会议。

此前,已有消息表明快手在大模型落地方面进展迅速。7 月 8 日,快手宣布正在内测智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。8 月 8 日,「快手 AI 对话」开启测试,以搜索场景为入口,为用户提供更多元、便捷的搜索形态,大为降低用户的搜索使用门槛,让新技术带来的便利惠及更广泛的人群。据悉,这两个新产品功能均基于「快意」大模型研发。

8 月 18 日,「快手 AI 对话」 功能已经在快手 APP 安卓版本开放内测,这也是短视频直播行业首个基于大语言模型落地的智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。参与测试的用户点击快手搜索首页右上角AI图标即可进入产品首页,选择输入内容对话或点击引导问题便可开启对话,或者触发「搜索智能问答」卡片,通过底部入口可以启用该功能。

快手App已内测AI对话功能

据称,快手AI团队将持续迭代「快意」大模型,一方面将继续优化模型性能并研发多模态能力 ,另一方面也在推进更多C端与B端业务场景下的落地 。可以预见,随着如「快意」等大模型的不断发展,AI的应用边界将得到进一步的拓宽,将能为用户带来更丰富的产品体验和更高效的服务。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )