谷歌推出Gemini Live：AI陪你聊天，模拟面试，还有演讲技巧推荐哦！

8月14日，谷歌在Pixel 9系列手机的新品发布会上，向世界展示了一项创新服务——Gemini Live。这项服务从今日起，将首先对使用英语的Gemini Advanced订阅者开放。

Gemini Live的推出，旨在提供一种全新的移动对话体验，让使用者能够与Gemini进行自由而流畅的对话交流。这项服务不仅能够实现更连贯、情感丰富、逼真的多轮对话，还允许用户在聊天机器人发言过程中随时打断，提出新的问题，而机器人将即时调整以适应用户的交流方式。

谷歌在博文中提到，用户可以通过Gemini应用程序与Gemini进行对话，并从10种新的自然声音中选择机器人的回应声音。用户可以按照自己的节奏进行对话，甚至在对话过程中随时打断，提出澄清性问题，这种体验与人类之间的自然对话无异。

"通过Gemini Live，用户可以与Gemini进行对话，选择它回应的自然声音，享受仿佛与真人对话般的体验。"

"用户可以自由地按照自己的节奏发言，或在对话中随时打断，提出问题，就像在与人类进行对话一样自然。"

在演示中，谷歌展示了Gemini Live的一个应用场景：模拟用户与招聘经理的对话，无论是人工智能还是真实的人类，都能为用户提供演讲技巧的建议和优化方案。

谷歌的发言人进一步阐释了Live服务的特点：

"Live服务采用了我们的Gemini Advanced模型，并对其进行了特别调整，以增强其对话性。在用户与Live进行长时间对话时，该模型的大型上下文窗口将发挥重要作用。"

尽管Gemini Live目前还不支持多模态输入，即无法通过手机摄像头捕捉并响应用户周围的环境，但谷歌曾在5月的I/O大会上展示了这一功能的潜力。当时，Gemini Live能够识别并命名坏掉自行车的零件，或解释电脑屏幕上的代码功能。谷歌表示，多模态输入功能将在"今年晚些时候"推出，尽管具体的时间表尚未公布。

随着Pixel 9系列手机的发布，Gemini Live服务的推出无疑为用户带来了更加智能化和个性化的交互体验，预示着未来人机对话的新方向。

相关文章

Anthropic首席科学家卡普兰：AI可能越变越强，最后反过来控制人类

豆包手机助手澄清误会：用的是系统自带截图功能，银行键盘这些保护内容截不了

马斯克的xAI和萨尔瓦多政府联手，Grok两年内进5000多所公立学校

铜价飙到快1.2万美元一吨，全因供应紧、AI需求旺

GPT-5.2被爆作弊：靠狂刷token偷袭谷歌，结果还不如Gemini 3

AI员工被一句周末好吗整疯了，狂聊200条，烧了30美元停不下来

发表回复 取消回复

发表回复取消回复