学習

学習

LLM、エージェント、RAG、モデル評価のための学習入口です。基礎・コース、実践的クックブック、推論・ホスティング API、公開ベンチマークとランキングをまとめています。外部リンクは新しいタブで開きます。掲載は情報提供であり、推奨や保証を意味しません。

更新 2026/04/22

Data-driven learning Q&A

基礎とコース

リソース	説明
Hugging Face Transformers	事前学習モデル、トークナイザー、ファインチューニングとコア API。
Stanford CS224N	NLP のためのディープラーニング：単語ベクトル、注意機構、Transformer と応用。
DeepLearning.AI	LLM、プロンプト設計、エージェント、RAG、ツールチェーンなどの短いコース。
The Illustrated Transformer	注意機構とエンコーダ・デコーダ構成の可視化された解説。
Lil’Log — LLM 関連	エージェント、プロンプト、RLHF などのサーベイとノート。
Papers with Code	タスク、論文、コード、領域横断のリーダーボード。
PyTorch ドキュメント	テンソル、自動微分、モジュール、分散学習——LLM 研究でよく使う。
Stanford CS336 — Language Modeling from Scratch	トークナイズ、学習、データ、スケーリング則、整合とシステムまでの言語モデル講義。
Hugging Face PEFT	パラメータ効率の良いファインチューニング：LoRA、アダプター、プロンプトチューニングなど。
Hugging Face TRL	教師ありファインチューニング、DPO、PPO、報酬モデリングなどの学習・整合ツール。
fast.ai	トップダウンで実践的なディープラーニング。LLM 専門の前の土台に。
Attention Is All You Need（論文）	Transformer の原論文。現代 LLM のアーキテクチャの基準。

クックブック、エージェントと RAG

リソース	説明
Hugging Face コース	Transformers、データセット、トークナイズ、NLP／LLM パイプライン。
OpenAI Cookbook	埋め込み、RAG、関数呼び出し、評価などのパターン。
Anthropic Cookbook	Claude SDK の例、プロンプト、ツール利用、長いコンテキスト。
LangChain ドキュメント	チェーン、ツール、エージェント、メモリと検索の統合。
LlamaIndex	データコネクタ、インデックス、RAG、文書向けエージェント。
DSPy	プロンプトとパイプラインを最適化可能なプログラムとして記述。
AutoGen（Microsoft）	マルチエージェント会話、ツール呼び出し、オーケストレーション。
vLLM	PagedAttention と OpenAI 互換 API による高スループット推論。
Semantic Kernel（Microsoft）	プラグイン、プランナー、コネクタで .NET／Python の LLM アプリを構築。
Haystack	RAG、検索、大規模ドキュメント QA のパイプライン。
Langfuse	LLM アプリの可観測性、トレース、評価。
PyTorch チュートリアル	基礎から NLP・分散学習までの公式チュートリアル。
NVIDIA Triton Inference Server	本番向けモデル配信、動的バッチ、複数フレームワークのバックエンド。

モデルと推論 API

リソース	説明
OpenAI API	チャット、埋め込み、画像、音声、バッチ、Assistants。
Anthropic API	Claude と Messages API。
Google AI for Developers	Gemini と関連する Google AI API。
Mistral AI	チャット、埋め込み、ファインチューニング。
Cohere	Command、Embed、分類、RAG 向けの API。
Hugging Face Inference	Hub 上モデルのホスティング推論。
Replicate	API と Webhook でオープンソースモデルを実行。
Together AI	オープンウェイトモデルの推論とファインチューニング API。
Ollama	ローカル LLM 配信。モデルカタログと CLI。
Groq	対応オープンモデル向けの高速推論 API（LPU）。
OpenRouter	複数プロバイダーとオープンウェイトをまとめる統一 API。
Azure OpenAI Service	Azure 上のエンタープライズ向け OpenAI モデルとリージョン展開。
Vertex AI（Google Cloud）	Gemini、チューニング、GCP 上の MLOps。
Fireworks AI	オープンモデル向けの高速推論とファインチューニング。

ベンチマークとランキング

リソース	説明
LMSYS Chatbot Arena	匿名の二択投票による LLM の横並び比較。
Open LLM Leaderboard	オープンウェイトモデルが主要ベンチマークでどうか（Hugging Face）。
HELM（Stanford）	多シナリオ・多指標で言語モデルを総合評価。
lm-evaluation-harness	広く使われる LLM ベンチマーク一式。論文やリポジトリでよく引用。
Papers with Code — SOTA	NLP・視覚などタスク別の最新結果のまとめ。
arXiv cs.CL	計算言語学の最新プレプリント。
LiveBench	データ汚染を抑えた評価。問題が頻繁に更新される。
SWE-bench	実際の GitHub Issue で、コーディングエージェントのリポジトリ規模タスクを評価。
Artificial Analysis	第三者によるモデル品質・速度・価格の比較。
MTEB Leaderboard	大規模テキスト埋め込みベンチマーク（検索・埋め込みモデルの順位）。