5月14日消息(颜翊)今日凌晨,OpenAI举行了一场发布会,正式发布了一款最新的GPT-4o多模态大模型。
OpenAI介绍,与现有模型相比,GPT-4o在视觉和音频理解方面尤其出色,可以在232毫秒内对音频输入做出反应,平均响应速度为320毫秒,这与人类在对话中的反应时间相近。而GPT-3.5和GPT-4用户以语音模式Voice Mode与ChatGPT对话的平均延迟时间为2.8秒和5.4秒。
在发布会演示中,GPT-4o甚至能够从OpenAI高管的喘气声中理解“紧张”的含义,并且指导他进行深呼吸。
该大模型可以处理50种不同的语言,并实时对音频、视觉和文本进行推理。相比GPT-4 Turbo,GPT-4o的速度快两倍,成本降低50%,API速率限制提高五倍。
OpenAI官网显示,GPT-4o将对用户免费开放,免费用户可获得分析数据、帮助总结、写作和分析等功能。
OpenAI的CEO Sam Altman发布博客文章表示,“新的语音(和视频)模式是我用过的最佳计算机界面。感觉(GPT-4o)就像电影里的AI一样。它的成真让我感到惊讶。”
- 谷歌AI掌门人Jeff Dean揭示AI提速300%秘密:工程师们,准备好迎接1000万倍的未来了吗?
- DeepSeek-R1-Zero训练揭秘:沈向洋等开源大神如何复刻1/30训练步骤,揭示RL训练新篇章
- 小米新机DeepSeek R1强势归来:超小爱助阵,联网搜索引领新潮流
- 京东云DeepSeek一体机升级:单台即可实现满血版V3/R1模型,高效便捷,不容错过!
- AI诗歌挑战:青春诗刊VS无脸投稿,谁将赢得这场AI文学之战?
- 青岛消防新宠:超能机器狗,救援利器破长程续航
- 商汤科技首席科学家王晓刚预测:日日新大模型6.0,颠覆性变革或将一触即发
- 微软 Copilot 惊艳新技能:一键生成AI视频,轻松拥有百万素材库
- 挪威1X公司惊艳家用人形机器人Neo Gamma:触感逼真到洗衣吸尘,革新未来生活!
- 上海发布国内首个算力生态超市,助力AI云计算企业降低成本,开启智能新篇章
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。