EXERCISE 90分

ストーリー

佐藤CTO
これがMonth 5の集大成だ
佐藤CTO
RAGベースのカスタマーサポートシステムを本番投入する計画を立ててほしい。アーキテクチャから評価パイプラインまで、全てを統合した設計だ

シナリオ

企業: SaaS企業「CloudServe」
目的: カスタマーサポートの60%をAIで自動回答
データ:
  - ヘルプドキュメント: 500ページ
  - FAQ: 1,000件
  - 過去のサポートチケット: 50,000件
要件:
  - 月間10万件のサポート問い合わせ
  - 回答精度: 90%以上(ユーザー満足度)
  - レスポンス: 初回トークン2秒以内
  - エスカレーション: AIが回答できない場合は人間に転送
  - 月額コスト: 100万円以内

Part 1: RAGアーキテクチャ設計(20分)

要件

カスタマーサポートAIのRAGアーキテクチャを設計してください。

解答例
ユーザー質問


クエリ分析・リライト

    ├─ FAQ完全一致 → 定型回答(LLM不要)


Hybrid Search(ベクトル + キーワード)


Re-ranking(Cross-encoder)


コンテキスト組み立て(Top-5ドキュメント)


LLM生成(ストリーミング)

    ├─ 信頼度高 → 回答返却
    └─ 信頼度低 → 人間エスカレーション

技術選定

コンポーネント選定理由
ベクトルDBpgvector(PostgreSQL拡張)既存DB活用、運用コスト低
エンベディングtext-embedding-3-smallコスト効率、日本語対応
LLMClaude Sonnet(メイン)+ Haiku(簡単な質問)コスト/品質バランス
Re-rankerCohere Rerank検索精度向上

Part 2: プロンプト設計(15分)

要件

カスタマーサポートAIのシステムプロンプトと回答品質基準を設計してください。

解答例
あなたはCloudServeのカスタマーサポートAIです。

## ルール
1. 提供されたドキュメントの情報のみに基づいて回答してください
2. ドキュメントに情報がない場合は「この質問については担当者にお繋ぎします」と回答
3. 回答は簡潔に、ステップバイステップで説明
4. 技術用語は平易な言葉で補足
5. 推測や独自の解釈は加えない

## 出力フォーマット
- 回答本文(100-300文字)
- 参考ドキュメントリンク(あれば)
- 信頼度: HIGH / MEDIUM / LOW

信頼度判定基準

信頼度条件アクション
HIGH検索スコア > 0.85、回答がコンテキストに完全一致自動回答
MEDIUM検索スコア 0.70-0.85回答表示 + 「不十分でしたら担当者に繋ぎます」
LOW検索スコア < 0.70自動エスカレーション

Part 3: コスト設計(15分)

要件

月額100万円以内で月間10万リクエストを処理するコスト計画を策定してください。

解答例
カテゴリ割合処理方法単価月額
FAQ一致30%ルールベース(LLM不要)¥0.1¥3,000
簡単40%Haiku + キャッシュ¥3¥120,000
普通25%Sonnet¥15¥375,000
複雑5%Sonnet(長コンテキスト)¥30¥150,000

インフラコスト

項目月額
LLM API¥648,000
pgvector(RDS)¥50,000
Re-ranker API¥100,000
アプリサーバー¥80,000
合計¥878,000

予算内(100万円以内)に収まる。


Part 4: 評価・モニタリング設計(20分)

要件

デプロイ前の評価パイプラインと本番モニタリングを設計してください。

解答例

デプロイ前評価

メトリクス閾値テストデータ
Faithfulness> 0.90200件の手動テストセット
Answer Relevancy> 0.85同上
エスカレーション率< 40%同上
p95レイテンシ< 5秒同上

本番モニタリング

指標閾値アクション
👎率> 15%アラート → プロンプト/検索レビュー
エスカレーション率> 40%ドキュメント拡充検討
TTFT p95> 3秒インフラスケール検討
日次コスト> ¥40,000コスト分析

Part 5: リリース計画(20分)

要件

段階的なリリース計画を策定してください。

解答例
フェーズ期間内容成功基準
Alpha2週間社内テスト(50名)満足度 > 80%
Beta2週間一部顧客(1,000社中50社)エスカレーション率 < 40%
GA 10%2週間10%のトラフィック👎率 < 15%
GA 50%2週間50%のトラフィックSLO全指標クリア
GA 100%-全トラフィック安定運用

ロールバック基準

  • 👎率 > 25% → 即座に前フェーズに戻す
  • エスカレーション率 > 60% → 即座に前フェーズに戻す
  • P1インシデント発生 → 即座に全停止

まとめ

ポイント内容
アーキテクチャHybrid Search + Re-ranking + モデルルーティング
プロンプト明確なルールと信頼度判定でエスカレーション制御
コストルールベース + モデルルーティングで予算内に収める
評価デプロイ前ゲート + 本番モニタリングの二重チェック
リリース段階的ロールアウトとロールバック基準

チェックリスト

  • RAGアーキテクチャを設計できた
  • プロンプトと信頼度判定を設計できた
  • コスト計画を予算内に収められた
  • 評価パイプラインとモニタリングを設計できた
  • 段階的リリース計画を策定できた

次のステップへ

最後は卒業クイズです。Month 5の全体を振り返りましょう。


推定読了時間: 90分