На презентации Pixel 9 компания Google представила Gemini Live — новый режим голосового чата, который обеспечивает более плавное и свободное общение для опытных пользователей Gemini. Он позволяет пользователям выбирать несколько голосов в разговоре и поддерживает прерывание, когда говорит другой человек, без каких-либо операций с экраном. Эта функция предназначена для того, чтобы сделать разговоры более естественными и эффективными, сохраняя их работу в фоновом режиме и предоставляя информацию в любое время, даже когда телефон заблокирован.
Google объявил о запуске режима голосового чата под названием Gemini Live при последнем выпуске Pixel 9. Эта функция предоставит опытным пользователям Gemini более гибкие возможности общения. Принцип работы Gemini Live аналогичен функции голосового чата ChatGPT. Пользователи могут выбирать несколько голосов для общения в разговоре, вести непрерывный разговор и даже перебивать собеседника во время разговора, не касаясь экрана.
Gemini Live разработан, чтобы позволить пользователям вести «свободный» разговор, то есть вы можете подключиться в любой момент, пока другой человек отвечает, или приостановить разговор, когда это необходимо, и вернуться к нему позже. Этот новый режим идеально подходит для пользователей, которым необходимо выполнять несколько задач одновременно, поскольку Gemini Live работает в фоновом режиме, даже когда телефон заблокирован, гарантируя, что у пользователей всегда будет доступ к информации.
Еще на конференции разработчиков ввода-вывода в этом году компания Google впервые объявила о выходе Gemini Live и заявила, что в будущем эта функция также будет поддерживать анализ видео в реальном времени. Теперь Gemini Live запущен на устройствах Android с начальной поддержкой английского языка и 10 новыми звуками на выбор пользователей, включая варианты под названием Ursa и Dipper. Google также заявил, что в ближайшие недели расширится на устройства iOS и другие языки.
Помимо Gemini Live, Google также запустил некоторые другие новые функции, в том числе предстоящие расширения приложений, включающие Keep, Tasks, Utilities и YouTube Music. Кроме того, Gemini также улучшает понимание контекста экрана пользователя, аналогично возможностям искусственного интеллекта, о которых Apple объявила на конференции WWDC. Пользователи могут получить информацию, нажав «Спросить этот экран» или «Спросить это видео», например, извлечь информацию о пункте назначения из видеороликов о путешествиях и добавить ее непосредственно на Карты Google.
Выделять:
Gemini Live представляет функцию голосового чата, обеспечивающую свободное и беспрепятственное общение.
? Добавлено 10 новых вариантов звука, пользователи могут выбирать разные звуки во время разговора.
В настоящее время эта функция доступна на устройствах Android, а в будущем она будет расширена на iOS и другие языки.
Запуск Gemini Live знаменует собой важный шаг для Google в области голосового взаимодействия с использованием искусственного интеллекта. Его плавный и естественный опыт общения и универсальность обеспечат пользователям более удобный и эффективный способ получения информации. Ожидается, что в будущем, благодаря улучшенным функциям и расширенной языковой поддержке, Gemini Live станет более мощным помощником искусственного интеллекта.