【太平洋科技讯】8月14日凌晨,谷歌在Pixel 9系列手机发布会上宣布推出新服务——Gemini Live。该服务将立即向英语地区的Gemini Advanced 用户提供。 Gemini Live 的设计目的是提供更自然的移动对话体验,让用户与AI 无缝沟通,并采用先进的语音引擎技术来媲美OpenAI 的ChatGPT 的高级语音模式,实现更流畅、更有情感的对话。多轮对话。
谷歌强调,Gemini Live允许用户在对话过程中随时打断AI并提出自己的问题。 AI会实时调整以适应用户的说话方式。用户通过Gemini应用程序与AI交谈时可以选择10种不同的自然声音。选择他们喜欢的响应声音。
发布会上,谷歌展示了Gemini Live如何模拟面试场景,为用户提供演讲技巧建议,并根据用户的表现提供优化建议。
Gemini Live 基于Gemini Advanced 模型构建,该模型经过优化,更适合长时间对话,并且能够处理大量上下文信息。
虽然谷歌在I/O大会上展示了Gemini Live的多模态输入功能,但该服务目前不支持该功能,也无法通过手机摄像头捕捉环境信息进行交互。