百度发布端到端语音语言大模型首发上线文小言，成本最高降90%！

3月31日，在百度AI DAY上，百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型，实现超低时延与超低成本，在电话语音频道的语音问答场景中，调用成本较行业均值下降约50%-90%。当日，文小言宣布品牌焕新，率先接入该模型，还带来多模型融合调度、图片问答等功能升级。

接入全新的端到端语音语言大模型后，文小言不仅能支持更拟真的语聊效果，而且支持重庆、广西、河南、广东、山东等特色方言。据介绍，语音大模型具备极低的训练和使用成本，极快的推理响应速度，语音交互时，可将用户等待时长从行业常见的3-5秒降低至1秒左右。

更新后的文小言还支持“多模型融合调度”，通过整合百度自研的文心X1、文心4.5等顶尖模型，并接入DeepSeek-R1等第三方优质模型，实现了多模型间的智能协同。用户可以选择“自动模式”，一键调用最优模型组合，也可根据需求灵活选择单一模型完成特定任务，大幅提升响应速度与任务处理能力。

同时，文小言还加强了图片问答功能，用户拍摄或上传图片，以文字或语音提问即可直接获取深度解析。例如，拍摄一道数学题可实时生成解题思路与视频解析；上传多款商品图可对比参数、价格，辅助购物决策；拍摄杯子设计图后，AI可自动解析风格并生成同款手机壳、支架等周边产品。

免责声明：此文内容为第三方自媒体作者发布的观察或评论性文章，所有文字和图片版权归作者所有，且仅代表作者个人观点，与极客网无关。文章仅供读者参考，并请自行核实相关内容。投诉邮箱：editor@fromgeek.com。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。

百度发布端到端语音语言大模型 首发上线文小言，成本最高降90%！

下一篇

百度发布端到端语音语言大模型首发上线文小言，成本最高降90%！