ストーリー
RAGとは何か
基本概念
RAG(Retrieval-Augmented Generation)は、外部の知識ソースから関連情報を検索(Retrieve)し、その情報をコンテキストとしてLLMに渡すことで、より正確で最新の回答を生成(Generate)する手法です。
RAGの基本フロー:
ユーザーの質問
↓
[1. Retrieval(検索)]
→ ベクトルDBから関連ドキュメントを検索
↓
[2. Augmentation(拡張)]
→ 検索結果をプロンプトに追加
↓
[3. Generation(生成)]
→ LLMがコンテキスト付きで回答を生成
↓
回答
なぜRAGが必要か
LLM単体には以下の限界があります。RAGはこれらを解決します。
| LLMの限界 | RAGによる解決 |
|---|---|
| 学習データの知識カットオフ | 最新のドキュメントを都度検索して参照 |
| ハルシネーション(幻覚) | 根拠となるドキュメントに基づいて回答 |
| 社内固有の知識がない | 社内文書をナレッジソースとして活用 |
| 回答の根拠を示せない | 参照元ドキュメントを明示可能 |
| 長大なコンテキストが必要 | 必要な部分のみを効率的に抽出 |
「LLMは頭がいいが、うちの社内事情は知らない。RAGは”社内のことを知っているLLM”を作る技術だ」 — 田中VPoE
RAGとFine-tuningの使い分け
LLMをカスタマイズするアプローチは主に2つあります。
| 観点 | RAG | Fine-tuning |
|---|---|---|
| 目的 | 外部知識の参照 | モデルの振る舞い変更 |
| データ更新 | リアルタイムで反映可能 | 再学習が必要 |
| コスト | 検索インフラ + API呼び出し | 学習コスト(GPU時間) |
| 実装難易度 | 中(検索パイプライン構築) | 高(学習データ準備、学習プロセス管理) |
| 適するケース | FAQ対応、ナレッジ検索、最新情報参照 | 文体統一、特定タスクの精度向上 |
| 回答の根拠 | 参照ドキュメントを提示可能 | 根拠の提示が困難 |
| 知識の鮮度 | 常に最新 | 学習時点に固定 |
判断フローチャート:
社内固有の知識を使いたい?
├── Yes → データは頻繁に更新される?
│ ├── Yes → RAG
│ └── No → RAG or Fine-tuning(コスト比較で判断)
└── No → モデルの出力スタイルを変えたい?
├── Yes → Fine-tuning
└── No → プロンプトエンジニアリングで対応
RAGの典型的なユースケース
| ユースケース | 概要 | RAGが適する理由 |
|---|---|---|
| 社内ナレッジ検索 | 技術文書、議事録、FAQ | 社内情報は常に更新される |
| カスタマーサポート | 製品マニュアル、トラブルシューティング | 正確な回答と根拠の提示が必要 |
| 法務・コンプライアンス | 規約、法令、ガイドライン | ハルシネーション許容度が極めて低い |
| 研究・開発支援 | 論文、特許、技術レポート | 膨大な文書から関連情報を効率的に抽出 |
| 教育・研修 | 研修資料、マニュアル | 最新の教材に基づいた回答が必要 |
Month 2のロードマップ
| Step | テーマ | 得られる成果 |
|---|---|---|
| 1 | RAGアーキテクチャの全体像 | RAGの基本概念、Embedding、ベクトルDB |
| 2 | ドキュメント処理とチャンキング | チャンキング戦略、前処理パイプライン |
| 3 | ベクトルDBと検索パイプライン | ハイブリッド検索、フィルタリング |
| 4 | 検索精度の最適化 | クエリ変換、Reranking、Self-RAG |
| 5 | 評価と運用 | RAGAS、モニタリング、運用設計 |
| 6 | 総合演習 | 社内ナレッジRAGシステム設計書 |
「RAGは単なる検索+生成ではない。ドキュメント処理、検索最適化、品質評価、運用設計まで含めた”システム”として構築する。それが実用的なRAGだ」 — 田中VPoE
まとめ
| ポイント | 内容 |
|---|---|
| RAGの基本 | 外部知識を検索し、LLMのコンテキストとして活用する手法 |
| 解決する課題 | ハルシネーション、知識のカットオフ、社内固有情報の欠如 |
| Fine-tuningとの違い | RAGは知識の拡張、Fine-tuningは振る舞いの変更 |
| Month 2の目標 | 社内ナレッジRAGシステムを設計・構築できるようになる |
チェックリスト
- RAGの基本フロー(Retrieval→Augmentation→Generation)を理解した
- RAGが解決するLLMの限界を説明できる
- RAGとFine-tuningの使い分け基準を理解した
- Month 2のロードマップを把握した
次のステップへ
次は「RAGアーキテクチャの進化」を学びます。Naive RAGからAdvanced RAG、Modular RAGへの発展を理解しましょう。
推定読了時間: 15分