学习中心
面向 LLM、Agent、RAG 与模型评测的学习入口:基础与课程、实战配方、推理与托管 API、公开基准与榜单。外链在新标签页打开;收录仅供查阅,不代表本站背书。
基础与课程
| 资源 | 说明 |
|---|---|
| Hugging Face Transformers | 预训练模型、分词器、微调与核心 API。 |
| Stanford CS224N | 面向 NLP 的深度学习:词向量、注意力、Transformer 与应用。 |
| DeepLearning.AI | LLM、提示工程、Agent、RAG 与工具链等短课程。 |
| 图解 Transformer | 注意力与编解码器架构的可视化讲解。 |
| Lil’Log(LLM 相关) | Agent、提示、RLHF 等主题的综述与笔记。 |
| Papers with Code | 任务、论文、代码与跨领域榜单。 |
| PyTorch 文档 | 张量、自动微分、模块与分布式训练——LLM 研究常用。 |
| Stanford CS336 — 从零构建语言模型 | 端到端大模型课:分词、训练、数据、扩展律、对齐与系统工程。 |
| Hugging Face PEFT | 参数高效微调:LoRA、适配器与提示微调等。 |
| Hugging Face TRL | SFT、DPO、PPO、奖励建模等训练与对齐工具。 |
| fast.ai | 自上而下实践深度学习,适合作为 LLM 专精前的基础。 |
| Attention Is All You Need(论文) | Transformer 原论文,现代 LLM 的架构基线。 |
配方、Agent 与 RAG
| 资源 | 说明 |
|---|---|
| Hugging Face 课程 | Transformers、数据集、分词与 NLP/LLM 流水线。 |
| OpenAI Cookbook | 嵌入、RAG、函数调用与评测等模式。 |
| Anthropic Cookbook | Claude SDK 示例、提示、工具调用与长上下文。 |
| LangChain 文档 | 链、工具、Agent、记忆与检索集成。 |
| LlamaIndex | 数据连接器、索引、RAG 与面向文档的 Agent。 |
| DSPy | 将提示与流水线声明为可优化程序。 |
| AutoGen(Microsoft) | 多智能体对话、工具调用与编排。 |
| vLLM | PagedAttention 与 OpenAI 兼容接口的高吞吐推理。 |
| Semantic Kernel(Microsoft) | 插件、规划器与连接器,构建 .NET/Python LLM 应用。 |
| Haystack | RAG、检索与大规模文档问答流水线。 |
| Langfuse | LLM 应用的可观测性、追踪与评测。 |
| PyTorch 教程 | 官方教程:从基础到 NLP 与分布式训练。 |
| NVIDIA Triton Inference Server | 生产级模型服务、动态批处理与多框架后端。 |
模型与推理 API
| 资源 | 说明 |
|---|---|
| OpenAI API | 对话、嵌入、图像、音频、批处理与 Assistants。 |
| Anthropic API | Claude 与 Messages API。 |
| Google AI for Developers | Gemini 及相关 Google AI API。 |
| Mistral AI | 对话、嵌入与微调。 |
| Cohere | Command、Embed、分类与面向 RAG 的接口。 |
| Hugging Face Inference | Hub 上模型的托管推理。 |
| Replicate | 通过 API 与 Webhook 运行开源模型。 |
| Together AI | 开放权重模型的推理与微调 API。 |
| Ollama | 本地大模型服务;模型库与 CLI。 |
| Groq | 面向多款开放模型的高速推理 API(LPU)。 |
| OpenRouter | 统一接口路由多家提供商与开放权重模型。 |
| Azure OpenAI Service | 企业级 Azure 上的 OpenAI 模型与区域部署。 |
| Vertex AI(Google Cloud) | Gemini、微调与 GCP 上的 MLOps。 |
| Fireworks AI | 开放模型的高速推理与微调。 |
评测与榜单
| 资源 | 说明 |
|---|---|
| LMSYS Chatbot Arena | 匿名双盲投票的 LLM 横向对比。 |
| Open LLM Leaderboard | 开放权重模型在常见基准上的表现(Hugging Face)。 |
| HELM(Stanford) | 多场景、多指标的整体语言模型评测。 |
| lm-evaluation-harness | 广泛使用的 LLM 基准套件;论文与仓库常引用。 |
| Papers with Code — SOTA | NLP、视觉等任务的最新结果汇总。 |
| arXiv cs.CL | 计算与语言方向最新预印本。 |
| LiveBench | 降低数据污染的评测,题目常更新。 |
| SWE-bench | 真实 GitHub Issue,评测编程类 Agent 在仓库级任务上的表现。 |
| Artificial Analysis | 第三方模型质量、速度与价格对比。 |
| MTEB Leaderboard | 大规模文本嵌入基准(检索与嵌入模型排名)。 |