大模型不仅要能用,还要好用、易用,什么样的大模型,能够真正让大家玩起来,用起来?
根据国家互联网信息办公室发布的《生成式人工智能服务已备案信息》,截止至今年 3 月,我国已有 117 家大模型成功备案。
除了部分面向 B 端的行业大模型之外,过去一年,不少通用大模型已经开始面向 C 端提供服务,诸如科大讯飞的讯飞星火、百度的文心一言、字节跳动的豆包、月之暗面的 Kimi 等诸多大模型应用都已在应用商城上架。
如此众多的大模型产品,到底哪款才更好用、更易用、更受用户欢迎?
市面上关于大模型的评测榜单五花八门,但这些榜单的评判标准不同、测试纬度不一,添加了太多限制条件,很难真正比较出大模型易用与否。
应用的下载量或许是最直接的指标,能够直观反映出用户的喜爱程度。据七麦数据显示,截止至今日,讯飞星火APP在安卓端的下载量已经超过9600万次,在国内工具类通用大模型APP中排名第一;星火 APP 在苹果 App Store 上的评论和打分也在国内同行中领先,星火 APP 的用户规模稳居行业第一阵营,广受用户欢迎。
为什么讯飞星火可以在一众大模型应用中脱颖而出?科大讯飞做对了什么?
模型底座能力是基础。讯飞星火今年更新的 V3.5 版本是首个基于全国产化算力平台“飞星一号”训练的全民开放大模型,整体能力接近 GPT-4 Turbo,语言理解、数学能力均已经超过 GPT-4 Turbo,代码能力达到 GPT-4 Turbo 的 96%,多模态理解达到 GPT-4V 的 91%,处在国际领先水平。
但除了模型能力的提升之外,想要收获 C 端用户的欢迎还要具备好用、易用等特点。讯飞星火发布之初,针对用户不知道如何使用大模型这一痛点,就上线了星火助手功能,可以一键生成专属于自己的个性化 AI 助手,甚至还可以直接对外发布,人人可用。
在星火 APP 的助手页面,你可以看到各式各样的 AI 助手,有工作场景的,比如 PPT 大纲助手,SWOT 分析助手,周报助手甚至是小红书文案助手;也有服务于编程的,Python、C++、java 等等编程语言应有尽有;趣味性的助手更多了,高情商助手、电影剧情大事、废话文学乃至冷笑话助手,让你能用也能玩。
时下大热的长文本功能讯飞星火也没错过,甚至比同类产品更进一步。科大讯飞 4 月 26 日发布的讯飞星火 V3.5 更新版本中,除了支持长文本,还支持长语音、长图文,这是业内首个同时支持长文本、长图文及长语音的大模型产品。不仅可以解决文字性的内容的整理,你在工作学习中随手拍的会议纪要、PPT照片乃至课堂录音等都可以发给讯飞星火。讯飞星火还针对性地推出了星火合同助手和科研助手,解决用户在工作生活场景中的刚需痛点。
科大讯飞董事长刘庆峰表示,一段时间以来,讯飞星火的开发者和用户都高度关注知识的获取和学习问题。在这个过程中和不仅要解决长文本的问题,能够把各种信息来源的海量文本快速的学习和问答,特别重要的还是在各种企业和专业行业应用的准确率问题,尤其在金融、在汽车、在政务等等非常关键的领域,大模型的回答要足够准确。
更关键的是,在保证准确的基础上,讯飞的长文本能力同时兼顾了效率问题。基于讯飞星火V3.5对长文本的理解、学习、回答能力,科大讯飞进行了重要的模型剪枝和蒸馏,从而推出业界性能最优的130亿参数的大模型,在效果损失仅3%以内的情况下,使得星火在文档上传解析处理、知识问答的首响时间以及文字生成方面都获得了极大的效率提升。测试显示,在保障长文本效果的情况下,无论是10K、64K、128K token,还是更长的文本上,星火大模型的性能都是业界最优的。
生活中,打工人遇到租房合同时经常头大,讯飞星火的长文本能力不仅可以上传电子合同,还可以实现随手拍纸质合同,一键帮你审核合同漏洞风险。讯飞星火赋能的的合同助手,可以实现风险审核、合同比对、摘要总结以及合同生成等功能。生活中遇到纠纷问题,也可以先问问“星火法律咨询”助手,工作中遇到暴力裁员应当如何应对?过年期间劝酒违法吗?这些疑问讯飞星火都能给出专业的法律解答。
专业能力过关,讯飞星火同时更有温度。早在今年 1 月,讯飞星火就首发了超拟人合成语音功能,让 AI 不再是冷冰冰的播音腔,同时具备超强的情绪感知能力,能像“知冷知热”的朋友一样带入情感互动,更具人情味。
这一技术的提升背后不仅得益于讯飞星火V3.5在语义理解、指令跟随和多轮对话的演示中展现的优异能力,还有在情绪感知和拟人合成方面的出色表现。
讯飞星火 V3.5 此次的更新版本中,这一功能再度加强,首发多情感超拟人合成功能,进一步提升了合成声音中情绪表达感知能力,情绪可感知度达到 85%以上,可以实现包括高兴、抱歉、安慰、撒娇、困惑等多种情感语气表达。
正如刘庆峰说,“技术在不断的进步,我们希望在安全可控的前提下,能够带来这个社会更有温度的人工智能的体验,能够真的帮助到那些特别需要帮助的人。今天这个世界更需要有温度的科技。”
不仅能用,还要好用、易用,这或许才是部分大模型应用在同质化竞争中脱颖而出的关键因素。科技不是冷冰冰的存在,AI 时代的科技更要能力与温度兼顾,方能收获大众的欢迎。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )