北京时间8月1日晚间消息(蒋均牧)OpenAI向一小部分付费订阅用户发布了一款语音助手,这项服务基于其先进的GPT-4o模型,据称能够复制自然的人类互动。
在社交媒体上的一系列帖子中,该公司解释说,它开始向少数GPT Plus用户推出高级语音模式,并补充说,预计到9月份,该类别下的所有用户都可以使用新产品。
OpenAI表示,视频和屏幕共享功能将补充语音模式。
开发人员指出,GPT-4o的语音功能已经由100多名外部安全专家进行了45种语言的测试。该模型经过训练,可以用四种预设的声音说话,以“保护人们的隐私”。
它还建立了一个系统来阻止默认声音之外的输出,并防止暴力或受版权保护的内容。
OpenAI声称,高级语音模式提供了“更自然的实时对话,允许你随时打断,并感知和回应你的情绪”。
今年5月,OpenAI将语音助手Sky从市场上撤下,原因是它被控未经同意复制女演员斯嘉丽·约翰逊(Scarlett Johansson)的声音。
最近,该公司推出了AI搜索功能的新原型SearchGPT,并计划将该服务与ChatGPT聊天机器人集成。该公司还开发了名为Sora的AI视频生成器。
相关新闻:
挑战谷歌?OpenAI开始测试基于AI的搜索功能
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 人工耳蜗价格大幅下调,从平均20余万元降至5万元左右,惠及更多听障患者
- Bing Image Creator升级:AI创作速度翻倍,必应搜索再添新功能,一键生成惊艳图片
- 2023:AI Agent风起云涌之年,揭秘智能体技术发展全貌
- 阿里云百炼上线音视频实时互动功能,人人都能创建专属多模态应用
- 字节跳动自主研发AI GPU,旨在减少对英伟达依赖
- 抖音副总裁李亮呼吁:用更低成本推动AI普惠,让技术改变生活
- 首个智能体安全生态协作组织成立:华为、荣耀、字节、蚂蚁等二十余家头部企业单位加入
- 人工耳蜗国采降价明显:最高降幅达38%,仿生品牌中标成赢家
- 初创公司 Odyssey 创新推出 AI 工具:将文字与图片秒变逼真 3D 场景,探索无限可能
- 谷歌新规引发外包人员担忧:被迫评估不擅长的“Gemini回复”,公平性成疑?
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。