期末考试结束了,带孩子来WAIC看看“最会做题的大模型”

期末考试结束,“神兽”放暑假了,带孩子去哪逛?来2024世界人工智能大会看看“更会做题的大模型”吧。带着孩子去感受中国科技力量,尤其是在大模型技术发展中,看到中国也有可以和世界PK的技术,对于从小培养孩子的科技创新能力和技术自信是非常有益的。

“能根据10岁儿童的口吻,写一篇不超过500字且以上海为主题的童话故事吗?”在上海世博展览馆科大讯飞的展台,6月27日全新升级发布的讯飞星火V4.0成为大家围观的焦点。面对观众提出来了各种文字问题,包括音视频、图片解读类的多模态问题,讯飞星火V4.0都对答如流,给出逻辑清晰且正确的回答。

现场,你可以带孩子一起体验在讯飞星火APP/DESK“个人空间”里上传工作、学习、生活、健康等各类资料,形成个人专属知识库,通过AI人设功能,让大模型生成更具个性化风格的内容,真正做到成为每个人在生活和工作中“用得上”的大模型。

2024世界人工智能大会前夕,基于全国首个国产万卡算力集群“飞星一号”,讯飞星火大模型V4.0七大核心能力全面升级,全面对标GPT-4 Turbo。6月27日举行的发布会上,科大讯飞根据《通用认知智能大模型评测体系》构建测试集,结果显示讯飞星火V4.0在文本生成、语言理解、知识问答、逻辑推理、数学能力等维度全面超越GPT-4 Turbo,代码与多模态能力也大幅提升。而在国际组织的12项测试集对比中,讯飞星火V4.0也实现了8项超越,其中理解与推理能力在四大机构测试中取得“全胜”战绩。

讯飞星火全面对标GPT-4 Turbo,可不是泛泛而谈,都是经过“实战”检验过的。

今年中高考真题实测中,一些专业机构纷纷下场,使用市面上常见的大模型产品如通义千问、字节豆包、讯飞星火、文心一言、腾讯元宝、月之暗面Kimi等作为“考生”,围绕“大模型高考测试”得出了一系列结果。综合来看,国产大模型在中国高考的表现不落下风,有着教育行业背景的讯飞星火大模型在一众大模型中表现抢眼,语数外各科“成绩”均排名第一,被评为“更会做题的大模型”。

(新京报测评结果,星火大模型表现最好)

在科研上,讯飞星火助力中国科学技术大学刘海燕教授团队,将蛋白质设计成功率从0.1%提升到64%,设计所需时间从6个月降到1天;赋能每个人,帮助一位不懂法律知识的70岁老人顺利要回养老钱欠款……家有孩子的,赶紧拿起手机,下载讯飞星火体验PK一把。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )