12月12日,谷歌在美国发布了一款名为Mariner的新型智能体(A.I. agent),标志着人工智能技术的又一次飞跃。这款实验性工具能够自主浏览网页,处理电子表格、在线购物等任务,并代表用户执行操作。
目前,聊天机器人的功能已经不仅限于回答问题或创作诗歌,它们正逐步发展为能够独立完成在线购物和电子表格操作的智能助手。
谷歌此次推出的Mariner智能体原型,是基于同日亮相的Gemini 2.0人工智能模型。Gemini作为谷歌人工智能产品和研究项目的核心,已被应用于聊天机器人和AI Overviews等工具中。
“用户只需在浏览器中提出需求,Mariner便能自动执行相应的任务,”谷歌项目经理贾克林·康泽尔曼在接受采访时表示。
Gemini是一个神经网络系统,通过分析大量数据来掌握新技能。例如,它能够通过识别互联网上的文章和书籍中的模式,实现自动文本生成。
最新版本的Gemini能够从多种数据类型中学习,包括文本、图像和声音,这使得Mariner能够模仿人类使用电子表格、购物网站等在线服务的行为。
“Mariner知道如何点击正确的按钮来完成任务,”谷歌核心人工智能实验室负责人德米斯·哈萨比斯解释道。“它能够在现实世界中执行任务。”
康泽尔曼强调,Mariner的设计初衷是与用户协作,例如在用户浏览商品时,Mariner可以自动将商品加入购物车,但最终的购买决策仍需用户亲自完成。
谷歌首席执行官桑达尔·皮查伊在博客中提到,这些技术进步使我们更接近实现通用助手的人工智能愿景。
作为Chrome浏览器的扩展功能,Mariner成为谷歌人工智能战略的关键部分。然而,谷歌的这一计划可能面临挑战,因为谷歌搜索引擎被裁定为非法垄断,美国司法部已要求联邦法院强制谷歌出售或拆分Chrome浏览器。
此外,这项技术本身也存在挑战。康泽尔曼承认,Mariner和其他聊天机器人一样,可能会因为依赖数据模式而犯错。虽然文本生成中的错误可能不易被察觉,但在尝试使用网站或执行操作时,错误可能会更加明显。
“Mariner能否做到完全准确?目前还不能,”康泽尔曼坦言。“这仍然是一个实验性的技术。”
目前,谷歌仅向少数外部测试人员开放了Mariner,全面发布的计划尚未公布。
同日,谷歌还展示了新版Project Astra,这款智能手机助手不仅能够响应图像和文本输入,还支持语音指令。与OpenAI今年早些时候推出的技术相似,Astra在功能上超越了苹果Siri等传统数字助理。
新版Project Astra也尚未公开发布。