1月9日消息,百川智能发布角色大模型Baichuan-NPC,该模型深度优化了“角色知识”和“对话能力”,使模型能够更好的理解上下文对话语义,更加符合人物性格地进行对话和行动,让角色栩栩如生。
此外,对于游戏领域AI角色开发成本高、周期长、自由度差、API不稳定等诸多不足, 百川智能推出了“角色创建平台+搜索增强知识库”的定制化解决方案。通过这一方案,游戏厂商无需编写任何代码,只需通过简单的文字描述,便可以快速构建出自己需要的角色,实现低成本、高效率的角色定制。
今日起,用户登录百川智能官网,即可开启角色创建之旅。
中文领域最强角色大模型
对于角色扮演而言,模型的基础能力既包括模型的通用智能水准,还包含角色知识、对话能力、情节演绎以及逻辑推理四个专项能力。而强化这些能力的最佳方式是在预训练阶段通过高质量数据集进行针对性训练。
据介绍,百川智能收集了海量行业网站、高质量书籍、优质剧本数据,对Baichuan-NPC进行了超过3T Tokens的领域知识预训练。此外,Baichuan-NPC还创新性地使用多方法模型合成数据进行预训练阶段的领域知识增强,针对性地缓解了Reversal Curse问题,大幅度提升Token利用效率。
角色扮演一致性问题指的是,通用语言模型在角色“演绎”过程中,非常容易跳出“角色设定”变回“智能助手”或做出不符合角色人设的言行,即业界所说的OOC问题(角色言行偏离原有设定,如:古代人物谈论现代事物)。
针对这一问题,百川智能首创将思维链对齐技术引入到角色模型对齐中。使用带有思维链的数据构造方式和带有思维链对齐的强化对齐方法,双管齐下让模型的思考过程和思考之后的行动表现更接近人类,大幅提升了角色一致性,显著增强模型的基础对话能力和角色演绎能力。
Baichuan-NPC通过强化模型基础能力,使用思维链对齐技术赋予角色模型类人的思考能力,使模型能够敏锐地捕捉上下文对话语义,生成更加符合人物性格地对话和行动,让角色效果栩栩如生。
在CharacterEval(由中国人民大学高瓴人工智能学院、北京邮电大学人工智能学院联合推出的对话类角色扮演Agent评估标准)评测中,Baichuan-NPC在对话能力、角色一致性、扮演吸引力等方面大幅领先,是目前中文领域最强角色模型。
评测维度 https://arxiv.org/pdf/2401.01275.pd
Baichuan-NPC对话能力、角色一致性、扮演吸引力大幅领先
可零代码复刻角色
将大模型的角色构建能力应用于具体场景,除了模型要具备强大的基础能力,简洁高效的开发流程同样至关重要。当前行业内的角色构建主要通过API调用实现。在实际创作中,需要产品、运营、技术等多个部门共同协作、反复调试,开发流程门槛高、周期长、效率低,最终的角色效果还难以保障。
对此,百川智能在Baichuan-NPC基础上推出了由“角色创建平台+搜索增强知识库”组成的开发套件,通过标准化模板、自定义选项、所见即得的调优界面及搜索增强知识库,为用户提供了一个高度自由且无需编写代码的低成本解决方案。
为提高角色定制自由度,百川智能自研了强多轮对齐和搜索增强知识库两项特色技术。强多轮对齐技术通过精心设计System Prompt中的角色设定字段,强化了角色创建平台System Prompt在对话Session中的特殊地位,保证了角色言行响应系统指令定制的敏感性和鲁棒性。简单来说,用户在系统提示(System Prompt)中定义了角色特征后,角色就会完全遵循用户设定进行相应的“演绎”。
不同性格孙悟空的不同演绎
AI角色知识储备量是决定能否自由定制角色的另一个重要因素。如果AI角色缺乏与其身份相符的知识,即使角色“演绎”的再努力,也会让人感觉“不真实”。
百川智能将搜索技术与角色知识能力深度融合,基于最新研发的SOTA模型BCTE(Baichuan-Text-Embedding),针对角色扮演场景优化了建库和召回算法,为角色和知识库提供了灵活的“多对多”关联方式。用户只需上传角色所需的知识文档并自定义回复方式,就能显著降低角色产生幻觉的可能性,极大地丰富了角色“内涵”。
创建好角色只是完成了角色定制的第一步,想要真正落到真实场景,还需要微调优化让其达到最佳效果。百川角色创建平台将微调选项和角色对话效果实时整合,实现了调优过程的“所调即所见”。
角色调试与生成效果实时同步
此外,平台还提供了一键复制功能。完成角色调试后,用户可以在查看代码页面一键复制全部角色代码,然后将角色代码集成到业务场景中。这种“所调即所得”的方式,极大降低了开发门槛,有效缩减了企业定制角色的时间和人员成本。
角色调试完成即可一键复制角色代码
目前,百川智能已经与众多泛娱乐行业的头部品牌建立了深度合作关系,共同拓展AIGC创作的应用场景。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 人类失误揭示AI越狱新途径?Anthropic研究:打错字可解锁GPT-4等AI模型
- AI安全对齐新探索:OpenAI深思熟虑,引领技术革新浪潮
- OpenAI o1-preview模型在医疗诊断中超越医生:发现AI新篇章
- 三星新款家用热泵 EHS 热泵热水器亮相 CES:7 英寸大屏智能控制,AI 家居新体验
- AI搜索暗面揭秘:ChatGPT误导用户,隐藏内容成操纵新手段
- 周鸿祎谈o3大模型:关于AGI 的定义,可能得改改了
- 阿里通义开源视觉模型惊艳业界:颠覆视觉推理,让物理思考触手可及
- 传谷歌利用Anthropic Claude模型改进自家Gemini AI模型,合规惹争议
- 消息称重启机器人团队仅一个多月的OpenAI 在考虑开发人形机器人
- 谷歌使用新模型改进 AI,揭秘 Anthropic Claude:AI 进步的关键一步?
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。