Частые вопросы
Типичные вопросы при просмотре рейтингов и трендов; при расхождении с развёртыванием приоритет документации в репозитории.
Являются ли баллы в таблицах производственными оценками?
По умолчанию — демонстрационные данные для вёрстки и сборки, не позиция по вендору.
Для публичных рейтингов, претендующих на доверие, JSON в data/rankings заменяется на вывод оценки/агрегации; в «Методология» документируются задачи, веса, даты и воспроизводимость.
Почему выбран статический сайт?
Статический HTML благоприятен для SEO, TTFB и глобального CDN кэширования. Рейтинги обновляются по дням или неделям через сборки, инициируемые CI.
При необходимости запросов в реальном времени допускаются read-only API на edge при сохранении статических снимков и ссылок на источники для аудита.
Сохраняется ли текущая страница при смене языка?
Часть пути за пределами префикса локали сохраняется (например /zh/models/ и /en/models/) для сопоставительного чтения.
Непереведённые длинные фрагменты могут временно совпадать с английским или другим языком по умолчанию — поэтапная локализация.
Как интерпретировать сводный балл?
Сводный балл агрегирует метрики после нормализации и взвешивания; удобен для обзора, недостаточен для анализа слабых задач. В производственной среде публикуются per-task баллы или подранги при наличии.
При смешении публичных бенчмарков указываются версии и обработка пропусков.
Как соотносятся тренды GitHub и рейтинги моделей?
Рейтинги моделей и агентов отражают способности и успешность задач; тренды GitHub — активность в OSS; они дополняют друг друга.
Большое число звёзд не означает SOTA по способностям; закрытый код или проекты вне GitHub в статистику трендов не входят.
Как подключить внутренний eval-пайплайн?
Типичный цикл: evaluators в CI, JSON в data/rankings или артефакты сборки, сборка Astro, развёртывание статического вывода.
Снимки из object storage сопровождаются URL и контрольной суммой на странице «Источники».
Безопасны ли внешние ссылки?
Внешние ссылки открываются в новой вкладке с noopener/noreferrer. Оценка достоверности и политики конфиденциальности целевых сайтов — ответственность посетителя.
Допускается ли встраивание или перепечатка таблиц?
Действуют лицензии на данные и код; при перепечатке указываются «Методология» и «Источники» с датой данных. Демонстрационные данные маркируются как sample-only.