Инструментальные цепочки от данных и обучения до оценки и релиза; демонстрационные данные.
Строки могут представлять наборы, платформы или OSS-бандлы; столбец охвата указывает этапы data, train, eval, deploy.
Public ranking policy: rows are sorted by composite score (desc). Composite score is a weighted sum of normalized sub-metrics; ties are broken by higher recent activity.
| Ранг | Тулчейн / набор | Сопровождение | Покрытие | Балл | Заметки |
|---|---|---|---|---|---|
| 1 | PipelineOne Enterprise | PipelineOne | 数据 → 训练 → 评测 → 发布 | 92.5 | 企业治理与审计 |
| 2 | BenchForge Suite | BenchForge | 基准构建与回归 | 91.2 | 可复现跑分 |
| 3 | EvalMesh | EvalMesh OSS | 评测编排与报表 | 89.8 | 插件化任务 |
| 4 | TrainRelay | Relay Systems | 训练与 checkpoint | 88.4 | 多云调度 |
| 5 | ArtifactHub CI | ArtifactHub | 构建 / 镜像 / 部署 | 87 | 与 Pages 类托管衔接 |
| 6 | DataWeave | Weave Data | 数据清洗与标注 | 85.6 | 隐私与脱敏 |
| 7 | GuardRails Lab | GuardRails | 安全与红队评测 | 84.3 | 策略与越狱集 |
| 8 | TraceKit | TraceKit | 推理观测与成本 | 83.1 | Token 与延迟分析 |