企業検索とナレッジマネジメントの急速に進化する分野において、 Onyx (以前は Danswer として知られていた)は技術系ユーザーの間で大きな注目を集めている注目すべきソリューションとして登場しました。このプラットフォームはオープンソースの生成AIと企業検索機能を組み合わせ、組織が内部文書、アプリケーション、人材を統一されたナレッジシステムに接続することを可能にします。
Onyx の特に興味深い点は、その機能セットだけでなく、検索機能を支える技術アーキテクチャであり、これがコミュニティディスカッションの焦点となっています。
![]() |
---|
Onyx の GitHub リポジトリで、そのコードベースと開発構造を紹介しています |
ハイブリッドインデックスアプローチ
Onyx の効果の中核にあるのは、キーワード頻度とベクトル埋め込みを組み合わせたハイブリッド文書インデックスシステムです。個々のアプリケーションのネイティブ検索機能に依存するソリューションとは異なり、 Onyx はすべての接続されたソースにわたる包括的な文書インデックスを構築します。このアプローチは、チーム固有の用語、自然言語クエリ、完全一致しないマッチングなど、企業検索における複数の重要な課題に対処します。
「文書インデックスは、キーワード頻度とベクトルのハイブリッドインデックスです。キーワードコンポーネントはチーム固有の用語などの問題に対処し、ベクトルコンポーネントは自然言語クエリと非完全一致を可能にします。」
このアーキテクチャにより、 Onyx はクエリ時間の前に文書を処理し、高速推論を可能にするLLMフレンドリーな表現を作成できます。システムはまた、文書の新しさなどの追加シグナルを取り入れ、すべてのソースにわたってより最新の情報を優先するための時間ベースの重み付けを適用します。
ディープリサーチ vs 従来のRAG
多くのコミュニティメンバーは、 Onyx のディープリサーチ機能が標準的な検索拡張生成(RAG)システムとどのように異なるのかを疑問に思っています。その違いは、エージェントが基盤となる検索インフラとどのように相互作用するかにあります。RAGが基本的なツールとして機能する一方で、 Onyx のディープリサーチエージェントは複数の検索を実行し、以前の結果を反映し、情報をより徹底的に探索するための思考連鎖の出力を生成できます。
このエージェントは、人間の研究者が複雑なトピックを調査する際に異なる調査スレッドをたどるのと同様に、さらに探求する質問を決定できます。これにより、単一クエリRAG実装と比較して、より動的で徹底的な研究プロセスが生まれます。
権限管理
企業ナレッジシステムにとって重要な課題は、異なるアプリケーション間の複雑な権限モデルを処理することです。 Onyx はこれに対して、外部オブジェクトとそれに関連するユーザー/グループをプラットフォーム内の統一された表現にマッピングすることで対処しています。
システムは、各外部ソースタイプに合わせて調整された設定可能な間隔で権限更新をチェックする非同期ジョブを実行します。このアプローチは、セキュリティを維持しながらアプリケーション間の検索を可能にし、常に最も制限の厳しいアクセスモデルをデフォルトとして、不正な情報露出を防止します。
パフォーマンスと評価
一般的な企業コンテンツ( Slack メッセージ、技術文書など)を含むデータセットを使用した内部評価では、 Onyx は印象的な結果を報告しています。10,000文書のテストセットでは、システムは4,000トークンで94%以上のリコールを達成し、ノイズを追加して数十万の文書に拡張しても90%以上のリコールを維持しました。
このプラットフォームは主に GPT-4o に対して開発されましたが、 Claude 3.5、 Gemini、 Deepseek などの他の最新モデルでも効果的に動作するように調整されています。
Onyxの主な特徴
- ハイブリッド文書インデックス作成(キーワード頻度+ベクトル)
- Google Drive、Confluence、Slack、Gmail、Salesforce などを含む40以上のコネクター
- 標準的なRAGを超えた高度な調査エージェント機能
- 異なるアプリケーション間での権限マッピング
- デプロイメントオプション:ローカル、オンプレミス、またはクラウド
- 2つのエディション:Community Edition(MITライセンス)とEnterprise Edition
パフォーマンス指標
- 10,000文書のテストセットで4,000トークンにおいて94%のリコール率
- 数十万の文書でも90%以上のリコール率を維持
- 複数のLLMバックエンドと互換性あり( GPT-4o 、 Claude 3.5 、 Gemini 、 Deepseek )
ロードマップ項目
- 新しい情報検索方法(StructRAG、LightGraphRAG)
- パーソナライズされた検索
- 組織理解とエキスパート提案
- コード検索
- SQLと構造化クエリ言語のサポート
今後の方向性
今後、 Onyx は LightGraphRAG のようなアプローチにインスパイアされたカスタマイズされたLLMベースのナレッジグラフを含む、いくつかの高度な情報検索方法を探求しています。その他の計画されている機能には、パーソナライズされた検索、専門家提案機能を備えた組織理解、コード検索、構造化クエリ言語のサポートが含まれます。
デジタルエコシステム全体でナレッジの発見と活用を改善したい組織にとって、 Onyx はローカル、オンプレミス、またはクラウドにデプロイできる興味深いオープンソースオプションを提供します。コミュニティエディションは MIT Expat ライセンスの下で自由に利用可能であり、大規模組織を対象とした追加機能を備えたエンタープライズエディションも利用可能です。
AI駆動の企業検索が進化し続ける中、 Onyx のディープリサーチ機能と統一文書インデックスを組み合わせたアプローチは、異なる情報源間のギャップを効果的に橋渡しする方法を示し、ナレッジワーカーが情報を見つけて合成するために必要な時間と労力を潜在的に削減します。