Gemini Live、第二言語サポートと画面共有機能で機能を拡張

BigGo Editorial Team
Gemini Live、第二言語サポートと画面共有機能で機能を拡張

Google は AI アシスタント機能の強化を続け、Gemini Live に新しい多言語機能と視覚的インタラクションツールをもたらしています。これらのアップデートは、AI アシスタントをより多用途で日常のシナリオで役立つものにするための大きな一歩であり、より自然で文脈に沿ったデジタルインタラクションを作り出すという Google のビジョンに基づいています。

Gemini Live に多言語サポートが登場

Google は Gemini Live に第二言語のサポートを展開する準備を進めており、ユーザーが同一セッション内で複数の言語で AI アシスタントと会話できるようになります。Android 向け Google アプリのベータ版 16.9.39.sa.arm64 で発見されたこの機能により、Spanglish、Hinglish などの言語の組み合わせでの会話が可能になります。Google の更新されたサポートページによると、Gemini Live は現在45以上の言語をサポートしていますが、ユーザーは当初、追加できる第二言語は1つに制限されます。実装されると、この機能は Gemini オーバーレイ、アプリケーション内、および Gemini Live の会話中に機能し、多言語ユーザーにとってアシスタントがより利用しやすくなります。

対応言語:

  • 合計45言語以上
  • 混合言語のサポート例: Spanglish 、 Hinglish 、イタリア語、フランス語
  • 現在はユーザーごとに1つの第二言語に制限されています

新しい視覚的インタラクション機能

言語強化に加えて、Gemini Live は DeepMind の Project Astra テクノロジーを活用した強力な新しい視覚機能を獲得しています。ユーザーはまもなく、スマートフォンのカメラを物体に向けて、アシスタントとリアルタイムで議論できるようになります。例えば、システムは陶器の花瓶のカラーサンプルをカメラで分析し、オプションについて自然な会話を維持しながらデザインの決定を手伝うことができます。さらに、Gemini Live は画面共有機能を追加し、アシスタントがユーザーの画面に表示されているコンテンツを認識して議論することができ、表示されている内容に関する文脈に沿った会話を可能にします。

Gemini Live の新機能:

  • 第二言語のサポート(現在ベータ版)
  • スマートフォンカメラを通じたリアルタイム動画分析
  • コンテキストに基づいた会話を伴う画面共有機能
  • DeepMind の Project Astra テクノロジーを搭載

AI アシスタントの未来

これらの開発は、AI アシスタントに対する Google の広範なビジョンを示唆しています。Google の Android 責任者である Sameer Samat 氏は、これらのスマートフォン機能はほんの始まりに過ぎず、将来のスマートグラスで可能になるかもしれないことを予見していると述べています。Project Astra の機能を Gemini に統合することは、音声、視覚、環境のコンテキストを同時に処理できるユニバーサル AI アシスタントという Google のビジョンに向けた重要な一歩です。この拡張されたコンテキストウィンドウにより、Gemini はユーザーが後で問題を解決する際に、教科書の図表など以前に見た情報を参照することができます。

イノベーションとユーザーの信頼のバランス

Google が AI 統合を推進する中、同社はイノベーションと消費者の信頼のバランスを取る必要性を意識しています。Samat 氏はテクノロジー自体よりもその利点に焦点を当てることを強調し、Google は大胆かつ責任ある方法で前進することを目指していると述べています。Google Glass 時代から学んだ教訓を踏まえ、同社はこれらの新機能がどのように機能するか、特にプライバシーに関する懸念について透明性を優先しています。この慎重なアプローチは、技術が準備できていても、Google が特定の機能で市場に最初に参入しないことを意味する場合があります。

AI エージェントとアプリの共存

AI エージェントが最終的に従来のアプリを置き換えるという懸念があるにもかかわらず、Samat 氏はそれらの共存について楽観的です。彼は AI エージェントを、既存のサービスの代替品というよりも、ユーザーがそれらをより良く活用するのを助ける個人アシスタントとして見ています。この見方は、Google がモバイルコンピューティングの未来を AI エージェントとサードパーティアプリケーションのパートナーシップとして捉えており、それぞれがユーザーエクスペリエンスにおいて補完的な役割を果たすと考えていることを示唆しています。

今後の展望

Google は明らかに AI をモバイルやパーソナルコンピューティングへの移行と同等の変革的技術と見なしています。同社の戦略は、AI 技術自体を強調するのではなく、ユーザーに具体的な利益を示すことに焦点を当てているようです。Samat 氏が述べたように、「消費者はこれらが実際に物事を成し遂げるのに役立つかどうかを知りたいだけです」。最終的な目標は、ユーザーが基盤となる技術を必ずしも意識することなく、それらから恩恵を受けるような、シームレスに統合された AI 機能を作ることのようです。