OpenAI против Google: Gemini запускает прямые трансляции, чтобы конкурировать с голосовым режимом ChatGPT — возникает новый вызов

Путем:C, Fiona
Last updated:08/14/2024
Why Trust BTCC
BTCC, a seasoned player in the cryptocurrency sector, has established a solid foundation of credibility through its over a decade of platform operation and profound industry experience. The platform boasts an experienced team of professional analysts who leverage their keen market insights and profound understanding of blockchain technology to offer precise market analyses and investment strategies to users. Furthermore, BTCC adheres to rigorous editorial standards, ensuring that every report and analysis is fact-based, striving for objectivity and fairness, thus providing investors with authoritative insights they can rely on. In the rapidly evolving cryptocurrency market, BTCC stands out as an indispensable partner for numerous investors and enthusiasts due to its stability, professionalism, and forward-thinking approach.

OpenAI против Google: Gemini запускает прямые трансляции, чтобы конкурировать с голосовым режимом ChatGPT — возникает новый вызов
OpenAI против Google: технологический гигант представляет Gemini Live, функцию голосового чата для своего AI-помощника Gemini, чтобы конкурировать с новым расширенным голосовым режимом OpenAI для ChatGPT. Эта инновационная функция, представленная на мероприятии Made by Google в 2024 году, будет доступна пользователям расширенного пакета, обещая беспрепятственное голосовое взаимодействие с технологией искусственного интеллекта. Следите за новостями об этом захватывающем развитии в гонке ИИ между Google и OpenAI.

OpenAI против Google: может ли Gemini Live бросить вызов голосовому режиму ChatGPT?

В теме на X компания объявила о запуске Gemini Live, стремящегося конкурировать с недавно представленным расширенным голосовым режимом OpenAI для ChatGPT. Эта новая функция, представленная на мероприятии 2024 года, теперь доступна пользователям Gemini Advanced, что делает взаимодействие с искусственным интеллектом более естественным и гибким. Пользователи могут свободно прерывать разговор, переключать темы или продолжать разговор, повторяя спонтанность телефонного звонка. Gemini Live выделяется своим новым речевым движком, который Google рекламирует как обеспечивающий связные, эмоционально заряженные и естественно плавные многоходовые диалоги. Предлагая 10 естественно звучащих голосов, он даже способен имитировать речь пользователя в режиме реального времени, поднимая возможности искусственного интеллекта на новый уровень. Более того, этот режим громкой связи работает бесперебойно в фоновом режиме или когда телефон заблокирован, обеспечивая непрерывные разговоры, пока пользователи выполняют многозадачность. С Gemini Live компания делает значительный шаг вперед в гонке искусственного интеллекта, бросая вызов OpenAI и формируя будущее голосового взаимодействия с искусственным интеллектом. .

Как мы можем улучшить взаимодействие с искусственным интеллектом?

Следовательно, модели помощника искусственного интеллекта Gemini 1.5 Pro и Gemini 1.5 Flash облегчают расширенные и сложные разговоры благодаря более длинному контекстному окну по сравнению с другими моделями генеративного искусственного интеллекта. Это усовершенствование позволяет Gemini Live участвовать в более продолжительных дискуссиях, сохраняя при этом данные более эффективно. Кроме того, компания объявила, что к концу года мультимодальный ввод, впервые продемонстрированный на Google I/O 2024, будет включен в Gemini Live и выйдет за рамки просто голосовых команд. Эта интеграция улучшит понимание и реагирование ИИ на визуальные сигналы, такие как изображения и видео, что сделает его еще более адаптируемым. В настоящее время это обновление предназначено исключительно для англоязычных пользователей Android, но ожидается поддержка дополнительных языков и устройств iOS.
Представляя свою последнюю функцию, компания готовится к дальнейшей интеграции и усовершенствованиям. В ближайшие недели Gemini получит новые расширения, совместимые с приложениями Google, включая Calendar, Keep, Tasks и YouTube Music. Эти интеграции обещают упростить повседневную работу пользователей, позволяя им эффективно управлять списками воспроизведения, напоминаниями и расписаниями с помощью простых голосовых команд. Кроме того, пользователи Android вскоре смогут активировать Gemini в любом приложении с помощью кнопки питания или голосовых подсказок. Эта инновационная функциональность позволит пользователям взаимодействовать с Gemini в различных приложениях, задавать вопросы или создавать контент, например изображения, который легко вписывается в их рабочие процессы.

Как OpenAI решает проблемы с помощью расширенного голосового режима?

В продолжающемся соперничестве OpenAI и Google внедрение Google Advanced Voice Mode для ChatGPT столкнулось с рядом проблем на начальном этапе альфа-тестирования. Хотя этот режим призван улучшить взаимодействие с пользователем, предлагая более реалистичное диалоговое взаимодействие, он вызвал критику за потенциальное усиление чрезмерной зависимости от ИИ из-за его очень реалистичного голосового обмена. Недавно OpenAI выразил обеспокоенность по поводу возникновения социальных связей между пользователями и ИИ, которые потенциально могут нанести вред отношениям между людьми. Чтобы решить эти проблемы и еще больше усовершенствовать свои возможности искусственного интеллекта, компания активно изучает способы повышения уровня разработки программного обеспечения своих моделей искусственного интеллекта. В рамках этих усилий OpenAI выпустила тестируемую вручную часть теста SWE-bench, предназначенную для более точной оценки того, насколько хорошо модели ИИ могут справляться с реальными проблемами программного обеспечения. Эта последняя разработка знаменует собой постоянную приверженность обеспечению того, чтобы достижения в области искусственного интеллекта оставались безопасными и практичными для повседневного использования.

Зарегистрируйтесь сейчас, чтобы начать свое крипто-путешествие

Скачайте приложение BTCC с App Store или Google Play

Подписывайтесь на нас

Просмотреть и скачать