Глоссарий
Ниже приведены рабочие определения для настоящего сайта; в академических и вендорских документах формулировки могут быть строже.
LLM
Большая языковая модель — обычно авто- или префиксная LM, обученная в крупном масштабе для чата, кода, рассуждений и инструментов; поведение зависит от размера и пост-тренинга.
Agent
Система, наблюдающая состояние, планирующая шаги и вызывающая инструменты для достижения цели; один или несколько агентов; оценка по успеху, числу шагов и стоимости.
Toolchain
Сквозной процесс: данные, обучение, оценка, развёртывание и наблюдаемость; в данном контексте акцент на повторяемость и поставку.
Benchmark
Стандартизированный набор задач и метрик для сравнения моделей и систем; дрейф версий и загрязнение данных меняют сопоставимость.
SSG
Static site generation — шаблоны и данные компилируются в файлы при сборке; серверный рендеринг по запросу не требуется.
RAG
Retrieval-augmented generation — извлечение релевантных фрагментов перед ответом; качество зависит от поиска и чанкинга.
Fine-tuning
Дообучение базовой модели на меньшем датасете под стиль, задачи или безопасность; риск катастрофического забывания и смещения.
Alignment
Методы согласования поведения с намерениями человека и ограничениями безопасности — RLHF, DPO, фильтры и т. п.
Quantization
Снижение точности весов и активаций для ускорения инференса и экономии памяти; проверка компромиссов по задачам.
Inference serving
Предоставление модели как онлайн-API или пакетных заданий; оптимизация пропускной способности, задержки, размера батча и использования оборудования.
Stars / Forks (GitHub)
Stars отражают интерес или поддержку; forks — копии для изменений; оба сигнала чувствительны к маркетингу; сверка с коммитами и issues.
Сводный балл
Скаляр из нескольких метрик после взвешивания; удобен для обзора; интерпретация требует подзадач и определений.