RAG入門 - L0 カリキュラム

ストーリー

田

田中VPoE

Month 1でLLMの基礎とプロンプトエンジニアリングを学んだな。今月はその知識を土台にして、実用的なRAGシステムを構築していく

あなた

RAGですか。「Retrieval-Augmented Generation」の略ですよね。最近よく聞きます

あ

田

田中VPoE

そうだ。NetShop社では社内の技術文書、議事録、FAQが膨大に蓄積されているが、必要な情報を見つけるのに時間がかかりすぎている。「あの仕様どこに書いてあったっけ？」という質問が毎日Slackで飛び交っている状況だ

あなた

確かに、検索しても古いドキュメントばかりヒットして、結局詳しい人に聞くことが多いですね

あ

田

田中VPoE

そこでRAGだ。社内ナレッジをベクトルDBに格納し、LLMと組み合わせて自然言語で質問すれば的確な回答が返ってくるシステムを作る。君にはそのRAGアーキテクトとしての役割を担ってもらう

RAGとは何か

基本概念

RAG（Retrieval-Augmented Generation）は、外部の知識ソースから関連情報を検索（Retrieve）し、その情報をコンテキストとしてLLMに渡すことで、より正確で最新の回答を生成（Generate）する手法です。

RAGの基本フロー:

ユーザーの質問
    ↓
[1. Retrieval（検索）]
    → ベクトルDBから関連ドキュメントを検索
    ↓
[2. Augmentation（拡張）]
    → 検索結果をプロンプトに追加
    ↓
[3. Generation（生成）]
    → LLMがコンテキスト付きで回答を生成
    ↓
回答

なぜRAGが必要か

LLM単体には以下の限界があります。RAGはこれらを解決します。

LLMの限界	RAGによる解決
学習データの知識カットオフ	最新のドキュメントを都度検索して参照
ハルシネーション（幻覚）	根拠となるドキュメントに基づいて回答
社内固有の知識がない	社内文書をナレッジソースとして活用
回答の根拠を示せない	参照元ドキュメントを明示可能
長大なコンテキストが必要	必要な部分のみを効率的に抽出

「LLMは頭がいいが、うちの社内事情は知らない。RAGは”社内のことを知っているLLM”を作る技術だ」 — 田中VPoE

RAGとFine-tuningの使い分け

LLMをカスタマイズするアプローチは主に2つあります。

観点	RAG	Fine-tuning
目的	外部知識の参照	モデルの振る舞い変更
データ更新	リアルタイムで反映可能	再学習が必要
コスト	検索インフラ + API呼び出し	学習コスト（GPU時間）
実装難易度	中（検索パイプライン構築）	高（学習データ準備、学習プロセス管理）
適するケース	FAQ対応、ナレッジ検索、最新情報参照	文体統一、特定タスクの精度向上
回答の根拠	参照ドキュメントを提示可能	根拠の提示が困難
知識の鮮度	常に最新	学習時点に固定

判断フローチャート:

社内固有の知識を使いたい？
├── Yes → データは頻繁に更新される？
│         ├── Yes → RAG
│         └── No → RAG or Fine-tuning（コスト比較で判断）
└── No → モデルの出力スタイルを変えたい？
          ├── Yes → Fine-tuning
          └── No → プロンプトエンジニアリングで対応

RAGの典型的なユースケース

ユースケース	概要	RAGが適する理由
社内ナレッジ検索	技術文書、議事録、FAQ	社内情報は常に更新される
カスタマーサポート	製品マニュアル、トラブルシューティング	正確な回答と根拠の提示が必要
法務・コンプライアンス	規約、法令、ガイドライン	ハルシネーション許容度が極めて低い
研究・開発支援	論文、特許、技術レポート	膨大な文書から関連情報を効率的に抽出
教育・研修	研修資料、マニュアル	最新の教材に基づいた回答が必要

Month 2のロードマップ

Step	テーマ	得られる成果
1	RAGアーキテクチャの全体像	RAGの基本概念、Embedding、ベクトルDB
2	ドキュメント処理とチャンキング	チャンキング戦略、前処理パイプライン
3	ベクトルDBと検索パイプライン	ハイブリッド検索、フィルタリング
4	検索精度の最適化	クエリ変換、Reranking、Self-RAG
5	評価と運用	RAGAS、モニタリング、運用設計
6	総合演習	社内ナレッジRAGシステム設計書

「RAGは単なる検索+生成ではない。ドキュメント処理、検索最適化、品質評価、運用設計まで含めた”システム”として構築する。それが実用的なRAGだ」 — 田中VPoE

まとめ

ポイント	内容
RAGの基本	外部知識を検索し、LLMのコンテキストとして活用する手法
解決する課題	ハルシネーション、知識のカットオフ、社内固有情報の欠如
Fine-tuningとの違い	RAGは知識の拡張、Fine-tuningは振る舞いの変更
Month 2の目標	社内ナレッジRAGシステムを設計・構築できるようになる

チェックリスト

RAGの基本フロー（Retrieval→Augmentation→Generation）を理解した
RAGが解決するLLMの限界を説明できる
RAGとFine-tuningの使い分け基準を理解した
Month 2のロードマップを把握した

次のステップへ

次は「RAGアーキテクチャの進化」を学びます。Naive RAGからAdvanced RAG、Modular RAGへの発展を理解しましょう。

推定読了時間: 15分