8月14日,谷歌在Pixel 9系列手机的新品发布会上,向世界展示了一项创新服务——Gemini Live。这项服务从今日起,将首先对使用英语的Gemini Advanced订阅者开放。
Gemini Live的推出,旨在提供一种全新的移动对话体验,让使用者能够与Gemini进行自由而流畅的对话交流。这项服务不仅能够实现更连贯、情感丰富、逼真的多轮对话,还允许用户在聊天机器人发言过程中随时打断,提出新的问题,而机器人将即时调整以适应用户的交流方式。
谷歌在博文中提到,用户可以通过Gemini应用程序与Gemini进行对话,并从10种新的自然声音中选择机器人的回应声音。用户可以按照自己的节奏进行对话,甚至在对话过程中随时打断,提出澄清性问题,这种体验与人类之间的自然对话无异。
"通过Gemini Live,用户可以与Gemini进行对话,选择它回应的自然声音,享受仿佛与真人对话般的体验。"
"用户可以自由地按照自己的节奏发言,或在对话中随时打断,提出问题,就像在与人类进行对话一样自然。"
在演示中,谷歌展示了Gemini Live的一个应用场景:模拟用户与招聘经理的对话,无论是人工智能还是真实的人类,都能为用户提供演讲技巧的建议和优化方案。
谷歌的发言人进一步阐释了Live服务的特点:
"Live服务采用了我们的Gemini Advanced模型,并对其进行了特别调整,以增强其对话性。在用户与Live进行长时间对话时,该模型的大型上下文窗口将发挥重要作用。"
尽管Gemini Live目前还不支持多模态输入,即无法通过手机摄像头捕捉并响应用户周围的环境,但谷歌曾在5月的I/O大会上展示了这一功能的潜力。当时,Gemini Live能够识别并命名坏掉自行车的零件,或解释电脑屏幕上的代码功能。谷歌表示,多模态输入功能将在"今年晚些时候"推出,尽管具体的时间表尚未公布。
随着Pixel 9系列手机的发布,Gemini Live服务的推出无疑为用户带来了更加智能化和个性化的交互体验,预示着未来人机对话的新方向。