開発者コミュニティで、40万以上の GitHub プロジェクトを異なる領域にマッピングした革新的な可視化が話題を呼んでいます。この可視化により、異なるテクノロジーやプログラミングコミュニティがどのように相互作用し、クラスター化しているかについての興味深い洞察が明らかになりました。この GitHub エコシステムを理解するためのユニークな地図的アプローチは、プログラミング言語コミュニティとその相互関連性について興味深い議論を引き起こしています。
主要な技術コンポーネント:
- データソース: GitHub のアクティビティイベント(2020年1月~2023年3月)
- 類似性指標: Jaccard 類似度
- クラスタリングアルゴリズム: Leiden クラスタリング
- 可視化: Maplibre
- データ処理:512GB RAMを搭載した AWS EC2 インスタンス
予想外の領域配置がコミュニティの重なりを浮き彫りに
マップのクラスタリングにより、テクノロジーコミュニティに関する従来の理解に挑戦するような、いくつかの驚くべき配置が明らかになりました。例えば、 Linux カーネル開発は、他のシステムプログラミングプロジェクトではなく、 JavaScript プロジェクトやフロントエンドツールと共に Fronterra に表示されています。この予想外の配置により、プロジェクトの貢献者とプロジェクトの支持者との関係について興味深いコミュニティ議論が生まれています。
おそらく、ヒートマップが実際には人口分布図を示していることと同じ理由です
注目すべき領域:
- Fronterra : JavaScript 、フロントエンドツール
- AILandia : Python 、AIプロジェクト
- Cloudderra :クラウドインフラストラクチャ、 YAML
- Rustland : Rust プログラミングプロジェクト
- Lispaña : Lisp 関連プロジェクト
言語コミュニティの興味深いサイズの違い
コミュニティから注目される観察として、プログラミング言語の型システムと領域サイズの相関関係があります。型のない言語が広大な領域を支配しており、 JavaScript ( Fronterra )、 YAML ( Cloudderra )、 Python ( AILandia )は、 Java や .NET などの静的型付き言語と比較して広大な地域を占めています。ただし、これは実際の使用状況というよりも、エンタープライズコードが多くプライベートリポジトリに残されているため、パッケージ公開の障壁の違いを反映している可能性があります。
AIと暗号通貨の領域が示す意外な重なり
マップでは、 BinanceLand が AILandia 内に位置しているように、AI関連プロジェクトと暗号通貨開発の間に興味深い近接性が示されています。この地理的な近さは、AIと暗号通貨コミュニティの間の重複する関心事について議論を呼び起こしていますが、一部のコミュニティメンバーは、暗号通貨には独自の「沈む船」という比喩が相応しいと冗談めかして提案しています。
革新的なクラスタリング手法
マップの作成には、共通のスターゲイザーに基づいてプロジェクト間の関係を決定する Jaccard 類似性を使用した高度なデータ処理が含まれています。このアプローチは概念的にはシンプルですが、プロジェクト間の意味のある関係を明らかにする上で効果的であることが証明されています。ただし、一部のコミュニティメンバーは、スターベースの指標がボットの活動の影響を受ける可能性があり、実世界での使用パターンを完全には反映していない可能性があると指摘しています。
この可視化は、オープンソースエコシステムを見る独特のレンズとして機能し、異なるテクノロジーとコミュニティがどのように相互作用するかについての洞察を提供すると同時に、これらの関係の本質についての議論を引き起こしています。
参考: Map of GitHub