谷歌在Pixel 9发布会上推出了Gemini Live,一种全新的语音聊天模式,为Gemini高级用户带来更流畅、自由的对话体验。它允许用户在对话中选择多种声音,并支持在对方说话时打断,无需任何屏幕操作。这项功能的设计理念是让对话更加自然和高效,即使在手机锁屏状态下也能保持后台运行,随时提供信息。
谷歌在最新的 Pixel9发布会上宣布推出了一项名为 Gemini Live 的语音聊天模式,这项功能将为 Gemini 的高级用户提供更为灵活的对话体验。Gemini Live 的工作原理与 ChatGPT 的语音聊天功能相似,用户可以在对话中选择多种声音进行交流,而且可以做到无缝的对话,甚至可以在对方讲话的同时进行打断,而无需轻触屏幕。
Gemini Live 的设计理念是让用户的对话变得 “自由流畅”,这意味着你可以在对方回答时随时插话,或者在需要的时候暂停对话,稍后再回来继续。这种新模式非常适合需要多任务处理的用户,因为即使在手机锁屏状态下,Gemini Live 也能在后台工作,确保用户随时都能获取信息。
早在今年的 I/O 开发者大会上,谷歌就首次透露 Gemini Live 即将到来,并表示该功能未来还将支持实时视频解析。现在,Gemini Live 已经在 Android 设备上推出,初期支持英语,并提供了10种新声音供用户选择,包括名字叫 Ursa 和 Dipper 的选项。谷歌也表示,未来会在几周内扩展到 iOS 设备和其他语言。
除了 Gemini Live,谷歌还推出了其他一些新功能,包括即将上线的应用扩展,涵盖 Keep、Tasks、Utilities 和 YouTube Music 等。此外,Gemini 还增强了对用户屏幕上下文的理解能力,类似于苹果在 WWDC 大会上发布的 AI 功能。用户可以通过点击 “询问这个屏幕” 或 “询问这个视频” 来获得信息,比如从旅行视频中提取目的地信息并直接添加到谷歌地图中。
划重点:
Gemini Live 推出了语音聊天功能,支持自由流畅的对话体验。
? 新增10种声音选项,用户可以在对话中选择不同的声音。
该功能目前在 Android 设备上推出,未来将扩展至 iOS 和更多语言。
Gemini Live 的推出标志着谷歌在 AI 语音交互领域迈出了重要一步,其流畅自然的对话体验和多功能性将为用户带来更便捷、高效的信息获取方式。未来,随着功能的完善和语言支持的扩展,Gemini Live 有望成为更强大的 AI 助手。