Amazon、競合を上回るタスク自動化能力を持つAIエージェント「Nova Act」を発表

BigGo Editorial Team
Amazon、競合を上回るタスク自動化能力を持つAIエージェント「Nova Act」を発表

質問に答えるだけでなく複雑なタスクを実行できるAIエージェントの開発競争が、 Amazon の最新参入により激化しています。この電子商取引大手は人工知能(AGI)開発における初の重要な進展を発表し、 OpenAI や Anthropic が支配する分野での強力な競合相手としての地位を確立しようとしています。

Amazon のAGIラボが初の一手を打つ

サンフランシスコを拠点とし、汎用人工知能の開発に特化した Amazon の AGI SF Lab は、初の主要製品である Amazon Nova Act を発表しました。この新しいAIモデルは、ウェブ閲覧から購入まで、オンラインでさまざまなタスクを実行できる高度なAIエージェントを強化するために特別に設計されています。元 OpenAI の幹部で、後にAIエージェントに特化したスタートアップ Adept を共同設立した David Luan が率いるこのラボは、最近まで出遅れ組と見なされていた AI 競争で追いつくための Amazon の本気の取り組みを示しています。

パフォーマンスの主張と競争優位性

Amazon によると、 Nova Act は AIエージェントの知性と適性を測定するために設計されたいくつかのベンチマークにおいて、 OpenAI や Anthropic などの業界リーダーのモデルを上回るパフォーマンスを示しています。具体的に Amazon は、 Nova Act が GroundUI Web および ScreenSpot ベンチマークにおいて Claude 3.7 Sonnet および OpenAI Computer Use Agent よりも優れたパフォーマンスを発揮すると主張しています。このパフォーマンス上の優位性は、急速に進化するAIエージェント市場で Amazon に競争力をもたらす可能性があります。

Amazon Nova Act の主な特徴:

  • GroundUI Web および ScreenSpot ベンチマークにおいて Claude 3.7 Sonnet および OpenAI Computer Use Agent を上回るパフォーマンスを発揮
  • ウェブ検索、購入、画面コンテンツに関する質問への回答が可能
  • 詳細な指示を認識できる(例:「保険のアップセルを受け入れないで」)
  • 一部のオンラインタスクですでに Alexa Plus アシスタントに実装済み
  • 現在は「研究プレビュー」として開発者のみが利用可能

技術的アプローチと開発戦略

一貫性のない派手なデモに焦点を当てるのではなく、 Amazon のアプローチは信頼性の高いAIエージェントの構築を重視しています。 Luan は、この課題を「Waymo問題」と呼ばれるものに例えています。これは自動運転車が公道で無人運転できるようになる前に、珍しいエッジケースに対処するための広範な訓練が必要だったことを指しています。

Nova Act は、 Amazon の最も強力な自社開発モデルである Amazon Nova をベースに、意思決定能力を向上させるための追加トレーニングを施しています。このモデルは、他のAIモデルが推論をよりよくシミュレートするのに役立った方法である強化学習によって強化されています。興味深いことに、 Amazon はまた物理的なロボット工学からもインスピレーションを得ており、 Luan のチームはAIのロボット工学応用を専門とするカリフォルニア大学バークレー校の教授 Pieter Abbeel が率いる別の Amazon グループと協力しています。

Amazon の AI 戦略:

  • Nova AI モデルは「同等の競合他社より少なくとも75%安価」とマーケティングされている
  • 派手なデモンストレーションよりも信頼性の高い AI エージェントの構築に焦点
  • Amazon の物流センターにおける物理的なロボティクス経験からインスピレーションを得ている
  • 元 OpenAI 幹部の David Luan が開発を主導
  • エージェント中心の開発を通じて AI 市場で競争するための幅広い戦略の一部

開発ツールとアクセシビリティ

採用とイノベーションを促進するために、 Amazon はエンジニアが Nova Act を使用してソフトウェアエージェントを構築しやすくするためのソフトウェア開発キット(SDK)をリリースしました。このSDKにより、開発者は主に人間のユーザー向けに設計されたインターネットをエージェントがナビゲートするのを助けるための具体的な指示を提供することができます。例えば、開発者はレンタカーを予約する際に「保険のアップセルを受け入れないでください」とエージェントに指示することができます。

現在の利用可能性と将来のビジョン

現在、 Nova Act は研究プレビューとして開発者にのみ提供されていますが、 Amazon は他の Nova AIモデルへのアクセスをウェブポータルを通じて拡大し、それらを見つけて使用しやすくしています。同社はすでに Nova Act の一部の機能をアップグレードされた Alexa Plus アシスタントに統合し、この技術の実用的な応用を示しています。

Amazon の AGI Labs はそのエージェントに対して野心的な目標を持っており、最終的には結婚式の企画や、ビジネス生産性を向上させる複雑なIT業務など、広範囲で複雑な多段階のタスクを実行することを構想しています。 Luan は Nova Act をそのビジョンの「最初の一歩」と表現し、より高度な機能が近い将来に登場することを示唆しています。

Amazon のAI戦略と競争上の位置づけ

Amazon は利用可能な最も強力なAIモデルを提供していると主張するのではなく、同社が比較可能な競合他社よりも少なくとも75パーセント安いと述べている Nova スイートのスピードと価値を強調しています。この価値提案は、 Amazon の膨大なリソースと既存のインフラストラクチャと相まって、比較的遅い参入にもかかわらず、AIエージェント市場での強力な競争相手としての地位を確立する可能性があります。

Amazon のAIエージェントへの参入は、電子商取引における将来の応用とも一致しています。同社の以前の研究では、エージェントがアイテムを見つけて購入するプロセスを自動化し、さらにはユーザーの興味や習慣に基づいて予防的に製品をカートに追加することで、オンラインショッピングをどのように改善できるかを探っています。

より広い業界への影響

Amazon のAIエージェント市場への参入は、主要テクノロジー企業が会話をするだけでなく行動を起こすことができるAIシステムの構築にますます焦点を当てるという、AI業界の重要な変化を示しています。これらのエージェントがより信頼性が高く能力が向上するにつれて、人々がテクノロジーとやり取りし、日常的なオンラインタスクを完了する方法が根本的に変わり、その過程で複数の産業に混乱をもたらす可能性があります。