OpenAI 近日宣布推出了一款名为 “Operator” 的全新 AI 代理工具,旨在为用户提供网络任务的自动化解决方案。根据官方博客的介绍,Operator 目前正处于 “研究预览” 阶段,仅对美国的 ChatGPT Pro 订阅用户开放,月费高达200美元。
Operator 的核心是基于一种名为 “计算机使用代理” 的先进模型,该模型融合了 GPT-4o 的视觉识别能力以及强化学习的高级推理技术,使其能够与图形用户界面(GUI)进行无缝交互。这意味着 Operator 可以通过内置浏览器查看网页,并通过键入、点击和滚动等操作与网页进行互动。这一创新技术的优势在于,它无需依赖定制的 API 集成,即可在网络环境中自主执行任务。
在实际使用中,Operator 的表现令人瞩目。它不仅能够利用自身的推理能力进行自我纠正,还能在遇到问题时主动将控制权交还给用户。例如,当网站要求输入敏感信息,如登录凭证时,Operator 会提示用户接管操作。此外,在处理如发送电子邮件等关键事务时,Operator 也会要求用户进行最终确认。OpenAI 强调,安全性是 Operator 设计的重中之重,它能够拒绝有害请求并屏蔽不被允许的内容。
OpenAI 还透露,Operator 正在与多家知名公司展开合作,包括 DoorDash、Instacart、OpenTable、Priceline、StubHub、Thumbtack 和 Uber 等,以确保该工具能够满足现实世界的需求,并严格遵循行业规范。然而,OpenAI 也提醒用户,Operator 目前仍处于早期阶段,在处理复杂界面时可能会遇到一些挑战,比如创建幻灯片或管理日历等任务。
展望未来,OpenAI 计划将 Operator 的功能逐步扩展至 Plus、Team 和 Enterprise 用户,并将其整合进 ChatGPT 中。这将使更多用户能够体验到这项前沿技术带来的便利,进一步推动 AI 在日常生活和工作中的应用。
感兴趣的读者可以访问 OpenAI 官方网站了解更多信息:https://openai.com/index/introducing-operator/
重点回顾:
🌐 OpenAI 推出 “Operator” AI 代理,助力用户在线完成任务,首批面向 ChatGPT Pro 用户。
🤖 Operator 能够通过浏览器与网页交互,具备自我纠正和用户控制功能,确保操作安全。
🤝 OpenAI 与多家知名企业合作,致力于满足实际需求,并计划未来向更多用户开放。