最新消息,谷歌正在紧锣密鼓地准备推出其备受期待的人工智能项目“Project Jarvis”,预计在12月向公众展示。据The Information的报道,这个项目将赋予用户前所未有的能力,通过执行“收集信息、在线购物或预订旅行”等任务,极大地简化日常生活。
据悉,“Jarvis”将由谷歌即将推出的Gemini版本提供动力,专为Chrome浏览器量身定制。这款工具的设计理念是通过捕捉屏幕快照、解析网页内容,并自动执行点击或输入操作,以实现“自动化用户在网页上的常规任务”。目前,该工具在执行不同任务时,可能会有短暂的延迟。
值得注意的是,大型AI公司都在竞相开发具有类似功能的模型。微软的Copilot Vision能够与用户就浏览的网页内容进行互动;苹果的Apple Intelligence预计在不久的将来将实现跨应用的屏幕识别功能;Anthropic最近推出的Claude测试版已经在计算机上实现了操作执行;而OpenAI也在积极研发类似的功能。
报道还指出,谷歌对于“Jarvis”的展示计划可能会有所调整,初步计划是先向一小部分测试者开放,以便收集反馈并修复可能出现的问题。