LESSON 15分

ストーリー

田中VPoE
Month 1でLLMの基礎とプロンプトエンジニアリングを学んだな。今月はその知識を土台にして、実用的なRAGシステムを構築していく
あなた
RAGですか。「Retrieval-Augmented Generation」の略ですよね。最近よく聞きます
田中VPoE
そうだ。NetShop社では社内の技術文書、議事録、FAQが膨大に蓄積されているが、必要な情報を見つけるのに時間がかかりすぎている。「あの仕様どこに書いてあったっけ?」という質問が毎日Slackで飛び交っている状況だ
あなた
確かに、検索しても古いドキュメントばかりヒットして、結局詳しい人に聞くことが多いですね
田中VPoE
そこでRAGだ。社内ナレッジをベクトルDBに格納し、LLMと組み合わせて自然言語で質問すれば的確な回答が返ってくるシステムを作る。君にはそのRAGアーキテクトとしての役割を担ってもらう

RAGとは何か

基本概念

RAG(Retrieval-Augmented Generation)は、外部の知識ソースから関連情報を検索(Retrieve)し、その情報をコンテキストとしてLLMに渡すことで、より正確で最新の回答を生成(Generate)する手法です。

RAGの基本フロー:

ユーザーの質問

[1. Retrieval(検索)]
    → ベクトルDBから関連ドキュメントを検索

[2. Augmentation(拡張)]
    → 検索結果をプロンプトに追加

[3. Generation(生成)]
    → LLMがコンテキスト付きで回答を生成

回答

なぜRAGが必要か

LLM単体には以下の限界があります。RAGはこれらを解決します。

LLMの限界RAGによる解決
学習データの知識カットオフ最新のドキュメントを都度検索して参照
ハルシネーション(幻覚)根拠となるドキュメントに基づいて回答
社内固有の知識がない社内文書をナレッジソースとして活用
回答の根拠を示せない参照元ドキュメントを明示可能
長大なコンテキストが必要必要な部分のみを効率的に抽出

「LLMは頭がいいが、うちの社内事情は知らない。RAGは”社内のことを知っているLLM”を作る技術だ」 — 田中VPoE


RAGとFine-tuningの使い分け

LLMをカスタマイズするアプローチは主に2つあります。

観点RAGFine-tuning
目的外部知識の参照モデルの振る舞い変更
データ更新リアルタイムで反映可能再学習が必要
コスト検索インフラ + API呼び出し学習コスト(GPU時間)
実装難易度中(検索パイプライン構築)高(学習データ準備、学習プロセス管理)
適するケースFAQ対応、ナレッジ検索、最新情報参照文体統一、特定タスクの精度向上
回答の根拠参照ドキュメントを提示可能根拠の提示が困難
知識の鮮度常に最新学習時点に固定
判断フローチャート:

社内固有の知識を使いたい?
├── Yes → データは頻繁に更新される?
│         ├── Yes → RAG
│         └── No → RAG or Fine-tuning(コスト比較で判断)
└── No → モデルの出力スタイルを変えたい?
          ├── Yes → Fine-tuning
          └── No → プロンプトエンジニアリングで対応

RAGの典型的なユースケース

ユースケース概要RAGが適する理由
社内ナレッジ検索技術文書、議事録、FAQ社内情報は常に更新される
カスタマーサポート製品マニュアル、トラブルシューティング正確な回答と根拠の提示が必要
法務・コンプライアンス規約、法令、ガイドラインハルシネーション許容度が極めて低い
研究・開発支援論文、特許、技術レポート膨大な文書から関連情報を効率的に抽出
教育・研修研修資料、マニュアル最新の教材に基づいた回答が必要

Month 2のロードマップ

Stepテーマ得られる成果
1RAGアーキテクチャの全体像RAGの基本概念、Embedding、ベクトルDB
2ドキュメント処理とチャンキングチャンキング戦略、前処理パイプライン
3ベクトルDBと検索パイプラインハイブリッド検索、フィルタリング
4検索精度の最適化クエリ変換、Reranking、Self-RAG
5評価と運用RAGAS、モニタリング、運用設計
6総合演習社内ナレッジRAGシステム設計書

「RAGは単なる検索+生成ではない。ドキュメント処理、検索最適化、品質評価、運用設計まで含めた”システム”として構築する。それが実用的なRAGだ」 — 田中VPoE


まとめ

ポイント内容
RAGの基本外部知識を検索し、LLMのコンテキストとして活用する手法
解決する課題ハルシネーション、知識のカットオフ、社内固有情報の欠如
Fine-tuningとの違いRAGは知識の拡張、Fine-tuningは振る舞いの変更
Month 2の目標社内ナレッジRAGシステムを設計・構築できるようになる

チェックリスト

  • RAGの基本フロー(Retrieval→Augmentation→Generation)を理解した
  • RAGが解決するLLMの限界を説明できる
  • RAGとFine-tuningの使い分け基準を理解した
  • Month 2のロードマップを把握した

次のステップへ

次は「RAGアーキテクチャの進化」を学びます。Naive RAGからAdvanced RAG、Modular RAGへの発展を理解しましょう。


推定読了時間: 15分