近日,谷歌在Pixel 9 系列手机发布会上宣布了一项重要的新AI 功能—— Gemini Live,为Gemini 高级订户用户带来全新的移动通话体验。 Gemini Live的推出标志着谷歌在AI语音交互领域的又一重大进展,为用户提供更加流畅、富有情感的对话体验。
Gemini Live是Google基于OpenAI ChatGPT推出的最新高级语音模式开发的。它使用增强的语音引擎来实现更加连贯、情感表达和真实的多轮对话。用户可以在聊天过程中打断Gemini提出后续问题,Gemini会实时适应用户的说话模式,实现无缝对话。这种交互方式让用户感觉更接近人类对话的自然流畅。
为了增强用户体验,Gemini Live 提供了10 种新的自然声音供用户选择,包括Ursa 和Dipper 等选项。用户可以根据自己的喜好和需求,选择不同的声音进行对话交流。此外,Gemini Live还支持在不触摸屏幕的情况下打断对方说话。该功能特别适合需要同时处理多项任务的用户。即使在手机锁定的情况下,Gemini Live也可以在后台工作,确保用户可以随时访问信息。
谷歌还演示了Gemini Live在模拟面试场景中的使用。用户可以与Gemini扮演的招聘经理进行对话。 Gemini不仅会回答用户的问题,还会根据用户的回答提供语音技巧建议和优化建议。这种模拟面试场景不仅可以帮助用户提高面试技巧,也可以让用户更直观地感受到Gemini Live在实际应用中的价值。
值得注意的是,Gemini Live 目前支持英语,计划在几周内扩展到iOS 设备和其他语言。这表明谷歌正在加速Gemini Live的全球化进程,让更多用户享受这一创新功能带来的便利。