中国电信星辰大模型通过双备案! 52B模型已全面开源

5月15日,根据北京市生成式人工智能服务已备案信息公告,中国电信人工智能研究院(TeleAI)自主研发的星辰大模型已通过备案。今年2月星辰大模型已通过 “境内深度合成服务算法备案” ,“双备案”标志着星辰大模型可正式对外提供生成式人工智能服务。

TeleAI作为最早布局大模型的央企机构之一,坚持全链路完全自主研发创新,去年便发布了千亿参数“星辰”语义大模型,性能处于国内同级别参数模型的前列。同步构建了语义、语音、视觉及多模态等全模态完备的大模型基础框架,基于星辰大模型的各领域算法已获国际顶会AI竞赛冠亚军24项。TeleAI逐步形成涵盖5大领域的前沿布局:1个智算云底座、1个通用大模型底座、1个数据底座、M个内部大模型、N个行业大模型。

TeleAI积极通过开源推动大模型技术进步和大模型国产化进程。在中国电信CTO、院长李学龙带领下,加快研发创新,接连开源7B、12B、52B参数规模大模型,吸引国内外开源社区开发者广泛讨论和使用,开源模型下载量过万,积累超40W+用户。

本次开源的TeleChat-12B-V2(星辰12B-V2),采用3.7万亿tokens高质量中英文预训练数据进行训练,并在SFT数据部分,针对幻觉、逻辑推理方向数据进行定向提升。在通用问答能力上较之前版本提升5.5%,在多轮数学性能上提升40.3%。

同时,进一步开源更大参数的语言模型TeleChat-52B(星辰52B),52B模型使用更高质量的数据、更科学的数据配比,采用课程学习方式,在通用问答能力上大幅超过12B模型,整体性能比肩甚至超过GPT 3.5-Turbo。本次除了开源chat版本模型外,还开源了基于Deepspeed的全参微调和Lora微调方法,供大模型技术研究者和需求开发者进行自主训练微调模型。据悉,中国电信人工智能研究院表示年内预计将开源千亿级参数大模型,逐步构建全尺寸开源格局,通过更丰富的应用场景、更广泛的落地应用、更繁荣的行业生态,助力中国大模型技术进步与落地应用。

据悉,星辰大模型已广泛应用落地,赋能千行百业转型升级。星辰语义大模型已落地某市民生诉求场景,为市民提供在线文本问答服务,提升政务服务能力,提高市民满意度;语音大模型一体机落地某小学防霸凌项目,星辰语音大模型采用亿级参数进行推理,可在嘈杂环境下,实现报警关键词的精准识别预报警,智能应对各种校园霸凌事件;星辰视觉大模型融入多源跨横态信息,面向公安、县乡综治、基层治理等公共安全管理单位,提供视频图像解析、聚档、视频语义检索等能力,助力智慧城市建设。星辰多模态大模型累计研发15种文生图、55种图生图能力,落地海报生成场景和卡券生成场景。

此外,中国电信凭借在各行业深耕多年的优势和经验,联合头部生态构建了涵盖教育、政务、应急等20多个行业大模型,深入推动大模型与各行各业的融合,切实赋能千行百业转型升级。

星辰大模型通过 “双备案”后,将进一步为客户、生态伙伴、开发者及个人用户等提供前沿的AI能力,赋能千行百业变革的同时也提升个人工作效率和日常生活便利性,切实推进国内AI技术进步及落地应用,加速全社会迈向通用人工智能时代。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )