OpenAI即将推出智能体能控制计算机并独立执行任务

人阅读

2025-01-23 10:07:01

来源：TechWeb.com.cn
相关关键词

1月23日消息，据外媒报道，人工智能初创公司OpenAI本周将发布一款能够控制计算机并独立执行任务的AI智能体（AI agent），项目代号为 “操作员”（Operator），有望成为人工智能领域的一大飞跃。

OpenAI准备在本周推出Operator，它可以在用户的网络浏览器中代表用户完成任务。Operator 将为用户提供旅游、餐饮和活动等类别的建议提示。例如，用户可以让Operator帮他们找到从纽约飞往毛伊岛（Maui）的最佳航班，而且不会让他们在晚上太晚降落。Operator不会完成交易，用户将最后完成结账流程。

外媒称，Operator可以在某些方面发挥作用。不懂电脑的老年人可以要求Operator帮助他们发送电子邮件，看到Operator导航到邮箱，并为他们打开撰写窗口。

精通技术的人可能不需要这种帮助，但老年用户在浏览网页时常常会遇到困难，即使是完成简单的任务也是一项挑战。Operator还可以在其他领域提供帮助，例如在质量保证测试中，公司可以利用AI服务，测试其新网站或服务是否能正常运行。

不过，所谓的 “计算机使用代理 ”也存在潜在风险。目前，已经有初创公司推出了一种网络导航机器人，可以自动完成在社交平台Reddit上发布营销垃圾邮件的过程。AI初创公司需要采取一些措施打击滥用行为，否则网站上的垃圾信息将比现在更加泛滥。

Operator这样的智能体基本上是通过截取用户浏览器的屏幕截图，然后将图像发送回OpenAI进行分析。它利用了OpenAI和其他公司一直在开发的多模态技术，该技术可以解读多种形式的输入信息，比如文本和图像。

所有领先的人工智能公司都已承诺推出自主人工智能代理，OpenAI首席执行官阿尔特曼（Sam Altman）去年曾表示：“我们会有越来越好的模型”，但 “我认为下一个巨大突破将是智能体”

AI初创公司Anthropic去年就推出了 “计算机使用 ”功能，通过API接入，开发人员可以指导Claude使用计算机，就像人们看屏幕、移动光标、单击按钮和输入文本一样。Claude能够将指令（例如，“使用我的计算机和在线数据填写此表单”）转换为计算机命令（例如，检查电子表格；移动光标打开web浏览器；导航到相关网页；使用这些网页中的数据填写表单等等）。

AI公司面临着越来越大的压力，AI模型成本高昂，它们必须找到变现方式：人们希望智能体能成为下一个突破性产品，一个具有ChatGPT影响力的创新。

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）