HelixDB、Neo4jの1000倍のパフォーマンスを主張する新しいグラフ-ベクトルデータベースを発表

BigGo Editorial Team

HelixDB、Neo4jの1000倍のパフォーマンスを主張する新しいグラフ-ベクトルデータベースを発表

オープンソースデータベースの世界に新たな競合が登場しました。 HelixDB は、RAG（Retrieval Augmented Generation）とAIアプリケーション向けに特別に設計された、Rustで書かれたグラフ-ベクトルデータベースです。コミュニティの注目を集めているのは、大胆なパフォーマンス主張とグラフとベクトル機能を組み合わせたユニークなアプローチです。


この GitHub ページでは、AI アプリケーション向けのオープンソースのグラフベクトルデータベースとしての HelixDB の構造が示されています

驚きを呼ぶパフォーマンス主張

HelixDB の開発者たちは、自社のデータベースが Neo4j より1000倍速く、 TigerGraph より100倍速い一方で、ベクトル処理では Qdrant と同等のパフォーマンスを持つと主張しています。これらの主張に対し、コミュニティメンバーは証拠を求め、あるユーザーは直接これらの主張を裏付けるベンチマークを要求しました。 HelixDB チームはベンチマークを実行したことを認めましたが、プロジェクト発表前に公開していなかったとし、詳細なパフォーマンスデータをドキュメントに追加することを約束しました。

HelixDBの主な特徴

高速かつ効率的: Neo4jより1000倍速く、 TigerGraph より100倍速く、ベクトル処理では Qdrant と同等の性能を謳っています
RAG優先: グラフとベクトルデータ型のネイティブサポート
グラフとベクトルの統合: ノード間、ベクトル間、またはノードとベクトル間の関係をサポート
ストレージ: LMDB（Lightning Memory-Mapped Database）を採用
ACID準拠: データの整合性と一貫性を保証
ベクトル次元: 現在は上限なし、将来的には約64,000次元に制限される見込み
クエリ言語: 型安全性を持つカスタムDSL
ライセンス: AGPL（Affero General Public License）

ベクトル機能と次元数

このデータベースは堅牢なベクトルサポートを持っているようで、開発者たちは現在ベクトル次元数に上限がないことを確認しています。将来的には Qdrant や Pinecone などの他のベクトルデータベースと同様に、約64,000次元の上限を実装する可能性があると言及しています。チームはまた、高次元ベクトルでのパフォーマンス向上のために数ヶ月以内にバイナリ量子化を実装する計画を明らかにし、ベクトル操作におけるパフォーマンスのトレードオフに対する認識を示しています。

グラフ-ベクトル統合が差別化要因

HelixDB を KuzuDB のような競合と区別するのは、グラフとベクトル機能を統合するアプローチです。開発者によると、 HelixDB はベクトルに対する増分インデックス作成をサポートしており、すべてのベクトルの完全な再インデックス作成を必要とせずに更新できます。これは、ベクトルインデックスがグラフ構造と完全に分離されていて、更新時に完全な再インデックス作成が必要になるという既存のソリューションの問題点に対処しています。

「基本的には他のグラフDBと同じ方法ですが、それらの間に明示的な関係を作成することでベクトルをノードとして扱うことができるという追加の利点があります。」

カスタムクエリ言語が議論を呼ぶ

HelixDB のカスタムクエリ言語は様々な反応を引き起こしています。一部のユーザーは、特にクエリ生成のためにLLMで使用する能力に関して、新しいドメイン固有言語（DSL）を学ぶ必要性について懸念を表明しました。開発者はこの選択を擁護し、既存の言語はグラフとベクトルの両方の機能を適切にカプセル化しておらず、型安全なクエリ言語を作成したかったと説明しています。彼らは、LLMが彼らの言語で文法的に正しいクエリを生成できるようにするために、彼らの文法を LLaMa の CPP コードに統合する作業を行っていると述べました。

ブラウザ互換性と組み込み使用

複数のユーザーが、プライバシー重視のアプリケーション向けに WebAssembly（WASM）を介して HelixDB をブラウザで実行することや、SQLite と同様に組み込みデータベースとして使用することについて質問しました。チームは、現在のストレージエンジンである LMDB がブラウザ互換性の障害となっていることを認めましたが、WASM サポートを備えた独自のストレージエンジンを開発する計画があると述べました。現時点では、 HelixDB は組み込みデータベースとして実行できないため、一部の潜在的なユースケースが制限されています。

ロードマップ項目

RAGアプリケーション向けのベクターデータ型機能の拡張
より堅牢な型チェックによるクエリ言語の強化
エンドツーエンドのクエリテスト用テストスイートの実装
決定論的シミュレーションテストエンジンの構築
パフォーマンス向上のためのバイナリ量子化の追加
スパース検索のための BM25 の実装
社内開発のグラフベクターストレージエンジン（ LMDB に代わるもの）の開発
社内開発のネットワークプロトコルとシリアル化ライブラリの作成

将来の開発とロードマップ

HelixDB チームはいくつかの今後の機能を概説しており、BM25を使用したスパース検索も含まれています。一部のコミュニティメンバーは、検索機能を強化するために SPLADE モデルの検討を提案しています。彼らのロードマップには、ベクトル機能の拡張、クエリ言語の強化、テストスイートの実装、決定論的シミュレーションテストエンジンの構築、そして最終的には LMDB に代わる独自のグラフ-ベクトルストレージエンジンの開発が含まれています。

HelixDB がますます競争が激化するベクトルとグラフデータベースの分野に参入する中、そのパフォーマンス主張とこれらの機能を組み合わせたユニークなアプローチは確かに注目を集めています。コミュニティは慎重ながらも楽観的であり、多くの人がデータベースを試してフィードバックを提供することに関心を示しています。 HelixDB が長期的に確立されたプレーヤーや他の新参者とどのように差別化していくかはまだ分かりませんが、開発者体験とAIアプリケーション向けのパフォーマンスに焦点を当てていることは潜在的なユーザーに共感を呼んでいるようです。

参考: HelixDB/helix-db