OpenAI 対 Google: Gemini がライバル ChatGPT の音声モードへのライブ ロールを開始 – 新たな課題が出現

著者:C, Fiona
最終更新日:08/14/2024
BTCCが選ばれる理由
BTCCは、仮想通貨分野のベテランプレーヤーとして、10年以上にわたるプラットフォーム運営と深い業界経験により、確固たる信頼基盤を確立しています。BTCCは経験豊富な専門アナリストチームを誇り、鋭い市場洞察力とブロックチェーン技術への深い理解を活かして、ユーザーに的確な市場分析と投資戦略を提供しています。一方、BTCCは厳格な編集基準を遵守し、すべてのレポートと分析が事実に基づき、客観性と公平性を追求することで、投資家に信頼できる権威ある洞察を提供しています。急速に変化する仮想通貨市場において、BTCCはその安定性、専門性、先見性により、多くの投資家や愛好家にとって不可欠なパートナーとして際立っています。

OpenAI 対 Google: Gemini がライバル ChatGPT の音声モードへのライブ ロールを開始 - 新たな課題が出現

OpenAI 対 Google: テクノロジー巨人は、ChatGPT 用の OpenAI の新しい高度な音声モードと競合するために、AI アシスタント Gemini の音声チャット機能である Gemini Live を発表しています。 2024 Made by Google イベントで公開されたこの革新的な機能は、アドバンスト パッケージのユーザーが利用できるようになり、AI テクノロジーによるシームレスな音声インタラクション エクスペリエンスが約束されます。 Google と OpenAI の間の AI レースにおけるこのエキサイティングな開発に関するさらなる最新情報に注目してください。

OpenAI 対 Google: Gemini Live は ChatGPT の音声モードに挑戦できるか?

Xのスレッドで同社は、OpenAIが最近発表したChatGPT用のAdvanced Voice Modeに匹敵することを目的としたGemini Liveの立ち上げを発表した。 2024 年のイベントで発表されたこの新機能は、Gemini Advanced ユーザーがアクセスできるようになり、より自然で柔軟なアプローチで AI インタラクションを強化します。 ユーザーは自由に中断したり、話題を切り替えたり、電話の自発性を反映して会話を続けることができます。 Gemini Live は、その斬新な音声エンジンで際立っており、Google は、一貫性があり、感情を揺さぶる、自然に流れるマルチターン対話を実現すると宣伝しています。 10 種類の自然な音声を提供し、ユーザーの音声をリアルタイムで模倣する機能も備えており、AI エクスペリエンスを新たなレベルに引き上げます。 さらに、このハンズフリー モードはバックグラウンドで、または電話がロックされているときにシームレスに動作するため、ユーザーがマルチタスクを行っている間でも会話が中断されません。 Gemini Live により、同社は AI 競争で大きな一歩を踏み出し、OpenAI などに挑戦し、音声ベースの AI インタラクションの未来を形作ります。 。

BTCC APP DOWNLOAD

Google Playで手に入れよう App Storeからダウンロード
日本ユーザー様限定特典(10,055USDTギフトパック) <<<<

AI インタラクションを強化するにはどうすればよいでしょうか?

その結果、AI アシスタントの Gemini 1.5 Pro および Gemini 1.5 Flash モデルは、他の生成 AI モデルと比較してコンテキスト ウィンドウが長いため、拡張された複雑な会話を容易にします。 この進歩により、Gemini Live はデータをより効率的に保存しながら、より長時間にわたるディスカッションに参加できるようになります。 さらに同社は、Google I/O 2024で初めて披露されたマルチモーダル入力が年末までにGemini Liveに組み込まれ、単なる音声コマンドを超えて拡張されることを発表した。 この統合により、画像やビデオなどの視覚的な手がかりに対する AI の理解力と応答性が強化され、適応性がさらに高まります。 現在、このアップグレードは英語を話す Android ユーザーに限定されていますが、追加の言語と iOS デバイスもサポートされる予定です。

同社は最新機能のデビューにあたり、さらなる統合と進歩に向けて準備を進めています。 今後数週間のうちに、Gemini はカレンダー、Keep、Tasks、YouTube Music などの Google アプリと互換性のある新しい拡張機能を受け取る予定です。 これらの統合により、ユーザーの日常業務が合理化され、簡単な音声コマンドを通じてプレイリスト、リマインダー、スケジュールを効率的に管理できるようになります。 さらに、Android ユーザーは間もなく、電源ボタンまたは音声プロンプトを介して、任意のアプリケーション上で Gemini をアクティブ化できるようになります。 この革新的な機能により、ユーザーはさまざまなアプリケーションにわたって Gemini を使用して、問い合わせをしたり、ワークフローにシームレスに溶け込む画像などのコンテンツを作成したりできるようになります。

OpenAI は高度な音声モードで課題にどのように取り組んでいますか?

現在進行中の OpenAI 対 Google の競争において、Google による ChatGPT 向けの Advanced Voice Mode の導入は、初期のアルファ テスト段階でいくつかの課題に直面しました。 このモードは、より現実的な会話のやり取りを提供することでユーザー エクスペリエンスを向上させることを目的としていますが、非常に現実的な音声交換により AI への過度の依存を助長する可能性があるとして批判を引き起こしました。 最近、OpenAI は、ユーザーと AI の間に社会的絆が生まれ、人間対人間の関係を損なう可能性があるという安全性の懸念を提起しました。 これらの問題に対処し、AI 機能をさらに洗練させるために、同社は AI モデルのソフトウェア エンジニアリング能力を強化する方法を積極的に模索してきました。 これらの取り組みの一環として、OpenAI は、AI モデルが現実世界のソフトウェアの課題にどれだけうまく対処できるかをより正確に評価できるように設計された、SWE ベンチ ベンチマークの人による評価のサブセットをリリースしました。 この最新の開発は、AI の進歩が安全かつ日常的な使用において実用的であり続けることを保証するための継続的な取り組みを示しています。

会員登録して仮想通貨投資を始めよう

AppleストアまたはGoogleプレイでBTCCアプリをダウンロード

BTCCの公式SNSをフォロー

QRコードを読み取りアプリをダウンロード