Глоссарий

Ниже приведены рабочие определения для настоящего сайта; в академических и вендорских документах формулировки могут быть строже.

LLM

Большая языковая модель — обычно авто- или префиксная LM, обученная в крупном масштабе для чата, кода, рассуждений и инструментов; поведение зависит от размера и пост-тренинга.

Agent

Система, наблюдающая состояние, планирующая шаги и вызывающая инструменты для достижения цели; один или несколько агентов; оценка по успеху, числу шагов и стоимости.

Toolchain

Сквозной процесс: данные, обучение, оценка, развёртывание и наблюдаемость; в данном контексте акцент на повторяемость и поставку.

Benchmark

Стандартизированный набор задач и метрик для сравнения моделей и систем; дрейф версий и загрязнение данных меняют сопоставимость.

SSG

Static site generation — шаблоны и данные компилируются в файлы при сборке; серверный рендеринг по запросу не требуется.

RAG

Retrieval-augmented generation — извлечение релевантных фрагментов перед ответом; качество зависит от поиска и чанкинга.

Fine-tuning

Дообучение базовой модели на меньшем датасете под стиль, задачи или безопасность; риск катастрофического забывания и смещения.

Alignment

Методы согласования поведения с намерениями человека и ограничениями безопасности — RLHF, DPO, фильтры и т. п.

Quantization

Снижение точности весов и активаций для ускорения инференса и экономии памяти; проверка компромиссов по задачам.

Inference serving

Предоставление модели как онлайн-API или пакетных заданий; оптимизация пропускной способности, задержки, размера батча и использования оборудования.

Stars / Forks (GitHub)

Stars отражают интерес или поддержку; forks — копии для изменений; оба сигнала чувствительны к маркетингу; сверка с коммитами и issues.

Сводный балл

Скаляр из нескольких метрик после взвешивания; удобен для обзора; интерпретация требует подзадач и определений.