LESSON 30分

ストーリー

田中VPoE
基本的な最適化手法を学んだところで、最先端のRAGパターンも押さえておこう
あなた
Graph RAGやAgentic RAGですか?よく耳にしますが、具体的にどういうものなんでしょうか
田中VPoE
従来のRAGは「フラットなドキュメントの検索」に限定されていた。だが現実のナレッジはドキュメント間の関係性、複数ステップの推論、動的なツール呼び出しを必要とする場合がある
あなた
例えばどんなケースですか?
田中VPoE
「AチームがBモジュールに加えた変更がCサービスの障害に繋がった経緯」のような質問は、複数のドキュメントを横断して関係性を追跡する必要がある。これは単純なベクトル検索では難しい

Graph RAG

基本概念

Graph RAGは、ドキュメント間やエンティティ間の関係性をナレッジグラフとして構築し、グラフの構造を活用して検索・推論を行う手法です。

Graph RAGの構造:

ナレッジグラフ:

[Qdrant] ──uses──→ [HNSW]
    │                  │
    │ is_a             │ is_a
    ↓                  ↓
[ベクトルDB]       [ANNアルゴリズム]

    │ stores

[Embedding] ──generated_by──→ [OpenAI]

検索時:
Q: "Qdrantが使っているインデックスアルゴリズムは?"
→ グラフを辿る: Qdrant → uses → HNSW
→ HNSWに関連するドキュメントチャンクを取得
→ LLMで回答生成

Graph RAGの構築ステップ

ステップ処理ツール
1. エンティティ抽出ドキュメントから固有名詞、概念を抽出LLM / NER
2. 関係抽出エンティティ間の関係を抽出LLM / 関係抽出モデル
3. グラフ構築ナレッジグラフを構築Neo4j / NetworkX
4. コミュニティ検出関連するエンティティをクラスタリングLouvain / Leiden
5. 要約生成コミュニティ単位で要約を生成LLM

Graph RAGの検索フロー

Graph RAGの検索:

[ローカル検索] 特定のエンティティに焦点
  Q: "Qdrantの特徴は?"
  → Qdrantノードから関連エッジを辿り、近傍の情報を収集

[グローバル検索] 全体の概要を把握
  Q: "うちのインフラの全体像は?"
  → コミュニティ要約を活用して全体的な回答を生成

Agentic RAG

基本概念

Agentic RAGは、AIエージェントがRAGパイプラインの各ステップを動的に制御する手法です。

Agentic RAGの処理フロー:

[Agent(LLM)]
    ├── 「このクエリにはどのツールが必要か?」を判断

    ├── Tool 1: ベクトル検索(社内ナレッジ)
    ├── Tool 2: SQL検索(構造化データ)
    ├── Tool 3: Web検索(最新情報)
    ├── Tool 4: コード実行(計算)
    └── Tool 5: API呼び出し(外部サービス)

    ├── 検索結果の評価 → 不十分なら別のツールで再検索

    └── 最終回答の生成

RAGとAgentの違い

観点通常のRAGAgentic RAG
検索戦略固定パイプライン動的に選択
ツールベクトル検索のみ複数ツール(検索、計算、API等)
ループ1回の検索→生成必要に応じて複数回の検索→評価→再検索
自律性低(事前定義されたフロー)高(LLMが判断)
複雑度
レイテンシ予測可能不定(ツール呼び出し回数に依存)

Multi-hop RAG

基本概念

Multi-hop RAGは、1回の検索では回答できない複雑な質問を、複数ステップの検索・推論で回答する手法です。

Multi-hop RAGの例:

Q: "Aチームがデプロイしたサービスで先月障害が発生し、
    その原因となった変更のプルリクエストを書いたのは誰?"

[Hop 1] "Aチームがデプロイしたサービスの先月の障害"
  → 結果: サービスXで11月15日に障害発生。原因はメモリリーク。

[Hop 2] "サービスXのメモリリークの原因となった変更"
  → 結果: PR #1234(キャッシュの設定変更)が原因。

[Hop 3] "PR #1234を作成したのは誰か"
  → 結果: 佐藤さんが作成。

最終回答: 「佐藤さんがPR #1234で行ったキャッシュの設定変更が
           メモリリークを引き起こし、サービスXの障害につながりました」

パターンの比較と選定

パターン実装難易度精度適するケース
標準RAG単一ドキュメントで回答できる質問
Graph RAG高(関係性)エンティティ間の関係を問う質問
Agentic RAG高(柔軟性)複数ツールの使い分けが必要な質問
Multi-hop RAG中〜高高(複合推論)複数ステップの推論が必要な質問

NetShop社への適用

パターン適用可能性Phase
標準RAG + Advanced手法最優先Phase 1-2
Multi-hop RAG中優先(技術調査の複合質問)Phase 2-3
Agentic RAG中優先(DB検索 + ドキュメント検索の統合)Phase 3
Graph RAG低優先(構築コストが高い)Phase 3以降

「高度なパターンを知ることは重要だが、まず標準RAGを十分に最適化すること。80%の質問は標準RAGで十分に回答できる。残りの20%のために段階的に高度な手法を導入していく」 — 田中VPoE


まとめ

ポイント内容
Graph RAGナレッジグラフでエンティティ間の関係性を活用
Agentic RAGAIエージェントが動的にツールを選択・実行
Multi-hop RAG複数ステップの検索・推論で複雑な質問に回答
選定基準まず標準RAGを最適化し、段階的に高度なパターンを導入

チェックリスト

  • Graph RAGの構築ステップと検索方法を理解した
  • Agentic RAGの特徴と通常のRAGとの違いを理解した
  • Multi-hop RAGの複数ステップ推論の仕組みを理解した
  • 各パターンの適用判断基準を理解した

次のステップへ

次は「演習:検索精度を最適化しよう」です。ここまで学んだ最適化手法を実際の検索パイプラインに適用して、精度を向上させましょう。


推定読了時間: 30分