人工知能と海洋生物学が交差する魅力的な取り組みとして、Google はイルカの言語を解読し、潜在的にコミュニケーションを取るという野心的なプロジェクトに着手しました。この革新的な取り組みは、Google の AI 機能と専用ハードウェアを組み合わせ、地球上で最も知能の高い生物の一つをより深く理解するための研究を支援します。
DolphinGemma AI モデル
Google はイルカの発声を分析・解釈するために特別に設計された DolphinGemma という AI モデルを開発しました。Google の既存の Gemma AI モデルをベースにした DolphinGemma は、Wild Dolphin Project(WDP)によって約40年にわたって収集されたイルカの音声の膨大なデータセットで訓練されています。このモデルはイルカの音声シーケンスを処理してパターンと構造を特定し、最終的には人間の言語モデルがテキストを処理するのと同様に、シーケンス内の次に来る可能性の高い音声を予測します。
Dolphin Communication Projectの主要コンポーネント:
- AIモデル: DolphinGemma (4億パラメータ)
- ハードウェア: Pixel スマートフォン(現在は Pixel 6、2025年に Pixel 9にアップグレード予定)
- 研究パートナー: Wild Dolphin Project、Georgia Institute of Technology
- 技術: SoundStream トークナイザー、CHAT(Cetacean Hearing Augmentation Telemetry)
- データソース: Wild Dolphin Project による40年間のイルカの音声記録
イルカの言語の複雑さ
イルカはホイッスル音、スコーク音、クリック音など様々な異なる音でコミュニケーションを取ります。これらの音のタイプはそれぞれ異なる状況や行動に対応しています。例えば、イルカは名前のように機能する特徴的なホイッスル音を使って、母親が子イルカを見つけることができるようにしています。クリック音はしばしば求愛行動やサメを追いかける行動に伴い、バースト・パルスのスコーク音は通常、対立の場面で発生します。これらの発声における構造とパターンは、研究者が解読したいと熱望している高度なコミュニケーションシステムを示唆しています。
フィールド研究ツールとしての Pixel スマートフォン
このプロジェクトが特に革新的なのは、Google の Pixel スマートフォンを主要な録音・処理デバイスとして使用している点です。フィールド研究者は Pixel スマートフォンを使用して、水中でリアルタイムにイルカの音を捉えています。スマートフォンは録音を Google の SoundStream トークナイザーで処理し、録音されると同時に音声を直接 DolphinGemma モデルに送ることができます。現在、研究者は Pixel 6 を使用していますが、2025年の夏の研究シーズンに向けて Pixel 9 にアップグレードする計画があります。
双方向コミュニケーションのための CHAT システム
単に聞いて分析するだけでなく、このプロジェクトはイルカとの基本的な双方向コミュニケーションの確立を目指しています。Wild Dolphin Project は Georgia Tech と提携して、CHAT(Cetacean Hearing Augmentation Telemetry)システムを開発しました。これはホンダワラ、海草、または研究者が使用するスカーフなど、イルカが好む特定の物体に関連付けられた合成ホイッスル音を作成するシステムです。イルカがこれらのアイテムを要求するためにこれらの音を模倣することで、種を超えた単純なコミュニケーション形態が生まれることが期待されています。
モバイル技術の実用的なメリット
Google のアプローチは、フィールド研究に大きな実用的利点をもたらします。DolphinGemma を Pixel デバイスで直接実行できるように最適化することで、特殊なハードウェアの必要性を劇的に減らし、システムの信頼性を向上させ、消費電力を削減し、コストを削減します—これらはすべて、遠隔の海洋環境で作業する研究者にとって重要な要素です。4億パラメータのモデルは、フィールドで使用されるモバイルデバイスで効率的に機能するように特別にサイズ設定されています。
オープンサイエンスのアプローチ
この研究の潜在的な幅広い影響を認識し、Google は今夏 DolphinGemma をオープンモデルとして共有する計画です。この AI は主にタイセイヨウマダライルカの音で訓練されましたが、Google はバンドウイルカやハシナガイルカなどの他の種の研究にも有用であると指摘しています。このオープンなアプローチは、世界中の研究を加速し、これらの高度に知能を持つ海洋哺乳類への理解を深めることを目指しています。
将来の展望
このプロジェクトの最終目標は、単にイルカのコミュニケーションパターンを理解することを超えています。研究者たちは最終的に、イルカが理解し反応できる音を構築し、種を超えた基本的なコミュニケーション形態を確立することを望んでいます。今後登場する Pixel 9 ベースの CHAT システムは、ディープラーニングとテンプレートマッチングを同時に実行でき、2025年の研究シーズン中にイルカとのよりスムーズな対話を可能にする可能性があります。