Text (LLM), image, video, and multimodal—alongside the combined Model board.
Model leaderboard (all)
タスク横断の総合(マルチモーダル/ビジョン/言語など。サンプルデータ)。
Cross-task overview; multimodal, vision, and language may split into additional columns or child boards once eval JSON is wired.
Public ranking policy: rows are sorted by composite score (desc). Composite score is a weighted sum of normalized sub-metrics; ties are broken by higher recent activity.
| 順位 | モデル | ベンダー/チーム | タイプ | スコア | メモ |
|---|---|---|---|---|---|
| 1 | Demo-Vision-Pro | Demo Lab | マルチモーダル | 94.2 | 画像とテキストのバランス |
| 2 | NorthStar-MM | North AI | マルチモーダル | 92.8 | 長いコンテキストに強い |
| 3 | Aurora-VL-7B | Aurora | ビジョン言語 | 91.5 | エッジ向き |
| 4 | Helix-3 | Helix Research | 汎用 | 90.1 | ツール呼び出しが安定 |
| 5 | Kite-Small | Kite | 言語 | 88.6 | コスパに優れる |
| 6 | Lattice-R1 | Lattice | 推論 | 87.9 | 数学/コードの部分スコアが高い |
| 7 | Pulse-Audio-2 | Pulse | 音声マルチモーダル | 86.4 | ASR/TTS の統合 |
| 8 | Quark-Mini | Quark Systems | 言語 | 85.2 | 低レイテンシ |