Text (LLM), image, video, and multimodal—alongside the combined Model board.
Model leaderboard (all)
Кросс-задачная производительность (мультимодальность / зрение / язык); демонстрационные данные; замена на производственный вывод оценки.
Обзор по кросс-задачам; мультимодальность, зрение и язык могут быть выделены в отдельные столбцы или дочерние таблицы после подключения JSON оценки.
Public ranking policy: rows are sorted by composite score (desc). Composite score is a weighted sum of normalized sub-metrics; ties are broken by higher recent activity.
| Ранг | Модель | Вендор / команда | Тип | Балл | Заметки |
|---|---|---|---|---|---|
| 1 | Demo-Vision-Pro | Demo Lab | 多模态 | 94.2 | 图像+文本均衡 |
| 2 | NorthStar-MM | North AI | 多模态 | 92.8 | 长上下文场景强 |
| 3 | Aurora-VL-7B | Aurora | 视觉语言 | 91.5 | 端侧友好 |
| 4 | Helix-3 | Helix Research | 通用 | 90.1 | 工具调用稳定 |
| 5 | Kite-Small | Kite | 语言 | 88.6 | 性价比突出 |
| 6 | Lattice-R1 | Lattice | 推理 | 87.9 | 数学/代码子项高 |
| 7 | Pulse-Audio-2 | Pulse | 语音多模态 | 86.4 | ASR/TTS 联合 |
| 8 | Quark-Mini | Quark Systems | 语言 | 85.2 | 低延迟 |