学習
学習
LLM、エージェント、RAG、モデル評価のための学習入口です。基礎・コース、実践的クックブック、推論・ホスティング API、公開ベンチマークとランキングをまとめています。外部リンクは新しいタブで開きます。掲載は情報提供であり、推奨や保証を意味しません。
Data-driven learning Q&A
基礎とコース
| リソース | 説明 |
|---|---|
| Hugging Face Transformers | 事前学習モデル、トークナイザー、ファインチューニングとコア API。 |
| Stanford CS224N | NLP のためのディープラーニング:単語ベクトル、注意機構、Transformer と応用。 |
| DeepLearning.AI | LLM、プロンプト設計、エージェント、RAG、ツールチェーンなどの短いコース。 |
| The Illustrated Transformer | 注意機構とエンコーダ・デコーダ構成の可視化された解説。 |
| Lil’Log — LLM 関連 | エージェント、プロンプト、RLHF などのサーベイとノート。 |
| Papers with Code | タスク、論文、コード、領域横断のリーダーボード。 |
| PyTorch ドキュメント | テンソル、自動微分、モジュール、分散学習——LLM 研究でよく使う。 |
| Stanford CS336 — Language Modeling from Scratch | トークナイズ、学習、データ、スケーリング則、整合とシステムまでの言語モデル講義。 |
| Hugging Face PEFT | パラメータ効率の良いファインチューニング:LoRA、アダプター、プロンプトチューニングなど。 |
| Hugging Face TRL | 教師ありファインチューニング、DPO、PPO、報酬モデリングなどの学習・整合ツール。 |
| fast.ai | トップダウンで実践的なディープラーニング。LLM 専門の前の土台に。 |
| Attention Is All You Need(論文) | Transformer の原論文。現代 LLM のアーキテクチャの基準。 |
クックブック、エージェントと RAG
| リソース | 説明 |
|---|---|
| Hugging Face コース | Transformers、データセット、トークナイズ、NLP/LLM パイプライン。 |
| OpenAI Cookbook | 埋め込み、RAG、関数呼び出し、評価などのパターン。 |
| Anthropic Cookbook | Claude SDK の例、プロンプト、ツール利用、長いコンテキスト。 |
| LangChain ドキュメント | チェーン、ツール、エージェント、メモリと検索の統合。 |
| LlamaIndex | データコネクタ、インデックス、RAG、文書向けエージェント。 |
| DSPy | プロンプトとパイプラインを最適化可能なプログラムとして記述。 |
| AutoGen(Microsoft) | マルチエージェント会話、ツール呼び出し、オーケストレーション。 |
| vLLM | PagedAttention と OpenAI 互換 API による高スループット推論。 |
| Semantic Kernel(Microsoft) | プラグイン、プランナー、コネクタで .NET/Python の LLM アプリを構築。 |
| Haystack | RAG、検索、大規模ドキュメント QA のパイプライン。 |
| Langfuse | LLM アプリの可観測性、トレース、評価。 |
| PyTorch チュートリアル | 基礎から NLP・分散学習までの公式チュートリアル。 |
| NVIDIA Triton Inference Server | 本番向けモデル配信、動的バッチ、複数フレームワークのバックエンド。 |
モデルと推論 API
| リソース | 説明 |
|---|---|
| OpenAI API | チャット、埋め込み、画像、音声、バッチ、Assistants。 |
| Anthropic API | Claude と Messages API。 |
| Google AI for Developers | Gemini と関連する Google AI API。 |
| Mistral AI | チャット、埋め込み、ファインチューニング。 |
| Cohere | Command、Embed、分類、RAG 向けの API。 |
| Hugging Face Inference | Hub 上モデルのホスティング推論。 |
| Replicate | API と Webhook でオープンソースモデルを実行。 |
| Together AI | オープンウェイトモデルの推論とファインチューニング API。 |
| Ollama | ローカル LLM 配信。モデルカタログと CLI。 |
| Groq | 対応オープンモデル向けの高速推論 API(LPU)。 |
| OpenRouter | 複数プロバイダーとオープンウェイトをまとめる統一 API。 |
| Azure OpenAI Service | Azure 上のエンタープライズ向け OpenAI モデルとリージョン展開。 |
| Vertex AI(Google Cloud) | Gemini、チューニング、GCP 上の MLOps。 |
| Fireworks AI | オープンモデル向けの高速推論とファインチューニング。 |
ベンチマークとランキング
| リソース | 説明 |
|---|---|
| LMSYS Chatbot Arena | 匿名の二択投票による LLM の横並び比較。 |
| Open LLM Leaderboard | オープンウェイトモデルが主要ベンチマークでどうか(Hugging Face)。 |
| HELM(Stanford) | 多シナリオ・多指標で言語モデルを総合評価。 |
| lm-evaluation-harness | 広く使われる LLM ベンチマーク一式。論文やリポジトリでよく引用。 |
| Papers with Code — SOTA | NLP・視覚などタスク別の最新結果のまとめ。 |
| arXiv cs.CL | 計算言語学の最新プレプリント。 |
| LiveBench | データ汚染を抑えた評価。問題が頻繁に更新される。 |
| SWE-bench | 実際の GitHub Issue で、コーディングエージェントのリポジトリ規模タスクを評価。 |
| Artificial Analysis | 第三者によるモデル品質・速度・価格の比較。 |
| MTEB Leaderboard | 大規模テキスト埋め込みベンチマーク(検索・埋め込みモデルの順位)。 |