学习中心

面向 LLM、Agent、RAG 与模型评测的学习入口：基础与课程、实战配方、推理与托管 API、公开基准与榜单。外链在新标签页打开；收录仅供查阅，不代表本站背书。

基础与课程

资源	说明
Hugging Face Transformers	预训练模型、分词器、微调与核心 API。
Stanford CS224N	面向 NLP 的深度学习：词向量、注意力、Transformer 与应用。
DeepLearning.AI	LLM、提示工程、Agent、RAG 与工具链等短课程。
图解 Transformer	注意力与编解码器架构的可视化讲解。
Lil’Log（LLM 相关）	Agent、提示、RLHF 等主题的综述与笔记。
Papers with Code	任务、论文、代码与跨领域榜单。
PyTorch 文档	张量、自动微分、模块与分布式训练——LLM 研究常用。
Stanford CS336 — 从零构建语言模型	端到端大模型课：分词、训练、数据、扩展律、对齐与系统工程。
Hugging Face PEFT	参数高效微调：LoRA、适配器与提示微调等。
Hugging Face TRL	SFT、DPO、PPO、奖励建模等训练与对齐工具。
fast.ai	自上而下实践深度学习，适合作为 LLM 专精前的基础。
Attention Is All You Need（论文）	Transformer 原论文，现代 LLM 的架构基线。

配方、Agent 与 RAG

资源	说明
Hugging Face 课程	Transformers、数据集、分词与 NLP/LLM 流水线。
OpenAI Cookbook	嵌入、RAG、函数调用与评测等模式。
Anthropic Cookbook	Claude SDK 示例、提示、工具调用与长上下文。
LangChain 文档	链、工具、Agent、记忆与检索集成。
LlamaIndex	数据连接器、索引、RAG 与面向文档的 Agent。
DSPy	将提示与流水线声明为可优化程序。
AutoGen（Microsoft）	多智能体对话、工具调用与编排。
vLLM	PagedAttention 与 OpenAI 兼容接口的高吞吐推理。
Semantic Kernel（Microsoft）	插件、规划器与连接器，构建 .NET/Python LLM 应用。
Haystack	RAG、检索与大规模文档问答流水线。
Langfuse	LLM 应用的可观测性、追踪与评测。
PyTorch 教程	官方教程：从基础到 NLP 与分布式训练。
NVIDIA Triton Inference Server	生产级模型服务、动态批处理与多框架后端。

模型与推理 API

资源	说明
OpenAI API	对话、嵌入、图像、音频、批处理与 Assistants。
Anthropic API	Claude 与 Messages API。
Google AI for Developers	Gemini 及相关 Google AI API。
Mistral AI	对话、嵌入与微调。
Cohere	Command、Embed、分类与面向 RAG 的接口。
Hugging Face Inference	Hub 上模型的托管推理。
Replicate	通过 API 与 Webhook 运行开源模型。
Together AI	开放权重模型的推理与微调 API。
Ollama	本地大模型服务；模型库与 CLI。
Groq	面向多款开放模型的高速推理 API（LPU）。
OpenRouter	统一接口路由多家提供商与开放权重模型。
Azure OpenAI Service	企业级 Azure 上的 OpenAI 模型与区域部署。
Vertex AI（Google Cloud）	Gemini、微调与 GCP 上的 MLOps。
Fireworks AI	开放模型的高速推理与微调。

评测与榜单

资源	说明
LMSYS Chatbot Arena	匿名双盲投票的 LLM 横向对比。
Open LLM Leaderboard	开放权重模型在常见基准上的表现（Hugging Face）。
HELM（Stanford）	多场景、多指标的整体语言模型评测。
lm-evaluation-harness	广泛使用的 LLM 基准套件；论文与仓库常引用。
Papers with Code — SOTA	NLP、视觉等任务的最新结果汇总。
arXiv cs.CL	计算与语言方向最新预印本。
LiveBench	降低数据污染的评测，题目常更新。
SWE-bench	真实 GitHub Issue，评测编程类 Agent 在仓库级任务上的表现。
Artificial Analysis	第三方模型质量、速度与价格对比。
MTEB Leaderboard	大规模文本嵌入基准（检索与嵌入模型排名）。