方法論

サンプルランキングの読み方と、本番データへの接続の考え方です。実スコア公開時も同じ説明を読者に提供してください。

Public ranking algorithms

All site lists are rankable and auditable. The formulas below are publicly documented in both UI and source code.

  • Leaderboards (Model / Agent / LLM / Toolchain)

    Sort order: composite score descending.

    Composite score: normalize each sub-metric with min-max, then compute a weighted sum. Ties are broken by higher recent activity (e.g., commits in the last 30 days).

  • Trend groups (GitHub)

    Within-group formula: Score = 100 × [0.30·Stars + 0.15·Forks + 0.30·Commits30d + 0.15·Contributors + 0.05·(1-Issues) + 0.05·(1-PRs)].

    All terms are min-max normalized within the same group; Issues/PR are inverse signals (lower is better).

レイヤーと次元

4 つのボードはモデル/エージェント/LLM/ツールチェーンに対応し、列は独立拡張できます(ベンダー、ドメイン、規模、カバレッジなど)。

総合スコアは重み付けと正規化で算出します。複数ベンチを併用する場合は、バージョン、重み、欠損処理を明記してください。

更新とリリース

静的ビルド:JSON や取得結果をコミットして SSG。

定期ジョブ:GitHub Actions で評価や集約を実行し、成果物を書き込んでビルドを起動。エッジの D1/KV は読み取り専用なら可ですが、静的優先の方針と両立させてください。

検証可能性

出典ページに主ソース、取得時刻、バージョンを列挙し、キャッシュやサンプリングがあれば開示します。読者は「方法論 ↔ 出典」で突き合わせられます。