Частые вопросы

Типичные вопросы при просмотре рейтингов и трендов; при расхождении с развёртыванием приоритет документации в репозитории.

Являются ли баллы в таблицах производственными оценками?

По умолчанию — демонстрационные данные для вёрстки и сборки, не позиция по вендору.

Для публичных рейтингов, претендующих на доверие, JSON в data/rankings заменяется на вывод оценки/агрегации; в «Методология» документируются задачи, веса, даты и воспроизводимость.

Почему выбран статический сайт?

Статический HTML благоприятен для SEO, TTFB и глобального CDN кэширования. Рейтинги обновляются по дням или неделям через сборки, инициируемые CI.

При необходимости запросов в реальном времени допускаются read-only API на edge при сохранении статических снимков и ссылок на источники для аудита.

Сохраняется ли текущая страница при смене языка?

Часть пути за пределами префикса локали сохраняется (например /zh/models/ и /en/models/) для сопоставительного чтения.

Непереведённые длинные фрагменты могут временно совпадать с английским или другим языком по умолчанию — поэтапная локализация.

Как интерпретировать сводный балл?

Сводный балл агрегирует метрики после нормализации и взвешивания; удобен для обзора, недостаточен для анализа слабых задач. В производственной среде публикуются per-task баллы или подранги при наличии.

При смешении публичных бенчмарков указываются версии и обработка пропусков.

Как соотносятся тренды GitHub и рейтинги моделей?

Рейтинги моделей и агентов отражают способности и успешность задач; тренды GitHub — активность в OSS; они дополняют друг друга.

Большое число звёзд не означает SOTA по способностям; закрытый код или проекты вне GitHub в статистику трендов не входят.

Как подключить внутренний eval-пайплайн?

Типичный цикл: evaluators в CI, JSON в data/rankings или артефакты сборки, сборка Astro, развёртывание статического вывода.

Снимки из object storage сопровождаются URL и контрольной суммой на странице «Источники».

Безопасны ли внешние ссылки?

Внешние ссылки открываются в новой вкладке с noopener/noreferrer. Оценка достоверности и политики конфиденциальности целевых сайтов — ответственность посетителя.

Допускается ли встраивание или перепечатка таблиц?

Действуют лицензии на данные и код; при перепечатке указываются «Методология» и «Источники» с датой данных. Демонстрационные данные маркируются как sample-only.