谷歌发布Gemini Live：支持AI语音聊天可模拟面试场景-玩转趣(WzQu.COM)

IT之家8 月14 日报道，谷歌在今天举行的Pixel 9 系列手机发布会上发布了Gemini Live 服务，该服务将从今天开始向说英语的Gemini Advanced 订阅者开放。

促进自然、流畅的对话沟通谷歌表示，Gemini Live 提供了一种移动对话体验，让用户能够与Gemini 进行自由流畅的对话。

Gemini Live可以说是OpenAI ChatGPT推出的最新高级语音模式（有限alpha测试）。它使用增强的语音引擎来发起更加连贯、情感表达和真实的多轮对话。

谷歌表示，用户可以在聊天机器人说话时打断其询问后续问题，聊天机器人将实时适应用户的说话模式。

IT之家翻译的谷歌博文部分内容如下：

通过Gemini Live [使用Gemini 应用程序]，用户可以与Gemini 交谈并从[10 种新的]自然声音中进行选择以进行响应。

用户甚至可以按照自己的节奏说话或中断回答以提出澄清问题，就像人类对话一样。

谷歌演示了Gemini Live的一个场景，模拟用户与招聘经理（或人工智能，视情况而定）之间的对话，为用户提供口语技巧建议并提供优化建议。

谷歌发言人表示：

Live 使用我们的Gemini Advanced 模型，我们对其进行了调整，使其更具对话性。当用户与Live 进行长时间对话时，会使用该模型的大型上下文窗口。

不支持多模式输入Gemini Live 尚不具备Google 在I/O 上展示的功能之一：多模式输入。

谷歌在5月份发布了一段预先录制的视频，显示Gemini Live通过手机摄像头捕捉到的照片和视频来观察用户周围的环境并做出反应，例如为一辆坏掉的自行车上的部件命名，或者解释电脑屏幕上的一些代码是什么做。

谷歌表示，多模式输入将在“今年晚些时候”推出，但拒绝透露具体细节。

谷歌推出人工智能语音聊天服务 用户可以随时打断并立即调整对话内容