EXERCISE 90分

ストーリー

田中VPoE
API Gateway、フォールバック、スケーリング、セキュリティ — サービング基盤の4つの柱を学んだ。ここからは実践だ。うちの3つのAIサービスに対して、統合的なサービング基盤を設計してもらう
あなた
設計書レベルのアウトプットですか?
田中VPoE
そうだ。この設計書をもとに実装に入る。曖昧さを残さず、具体的な設定値まで落とし込んでくれ

ミッション概要

項目内容
演習タイトルAIサービング基盤設計
想定時間90分
成果物サービング基盤設計書(アーキテクチャ図 + 設定仕様 + セキュリティ設計)

前提条件

Step 1の演習で使用した3つのAIサービスの情報に加え、以下の追加要件があります。

追加要件

要件内容
可用性目標CS-AI: 99.9%、FAQ Bot: 99.5%、コードレビュー: 99.0%
レスポンス目標CS-AI: P95 5秒以内、FAQ Bot: P95 8秒以内
セキュリティCS-AIのログにはPII保護が必須
予算制約インフラ追加コスト月額10万円以内
将来計画6ヶ月後に2つのAIサービスを追加予定

Mission 1: API Gatewayアーキテクチャ設計

要件

  1. アーキテクチャ図を作成(テキストベースでも可)
  2. ルーティングテーブルを設計(サービス別のモデル・プロバイダ割当)
  3. レート制限設計(グローバル、サービス別、ユーザー別)
  4. APIキー管理方式の設計
解答例

ルーティングテーブル

サービス優先度PrimarySecondary理由
CS-AI(複雑)CriticalGPT-4oClaude 3.5 Sonnet顧客対応品質を最優先
CS-AI(簡易)CriticalGPT-4o-miniClaude 3.5 Haikuコスト効率。定型応答
FAQ BotHighClaude 3.5 SonnetGPT-4o既存プロンプトがClaude向け
コードレビューNormalGPT-4oClaude 3.5 Sonnet非同期処理可。品質重視

レート制限

レベル制限値根拠
グローバル400 req/minOpenAI Tier 3の TPM制限から逆算
CS-AI200 req/minピーク時500件/時 ÷ 60 × 安全係数3
FAQ Bot100 req/minピーク時150件/時 ÷ 60 × 安全係数3
コードレビュー50 req/min非同期のため低く設定可能
ユーザー単位10 req/min乱用防止

Mission 2: フォールバック設計

要件

  1. フォールバックチェーンを各サービスごとに設計
  2. サーキットブレーカーのパラメータを決定
  3. グレースフルデグラデーションの段階を定義
  4. 障害シナリオ別の想定動作を記述
解答例

CS-AIのフォールバックチェーン

段階条件動作ユーザーへの影響
Primary正常時GPT-4o で応答なし
SecondaryGPT-4o 障害Claude 3.5 Sonnet に切替微小な応答スタイルの変化
Tertiary両プロバイダ障害GPT-4o-mini に切替品質低下(告知あり)
Cache全LLM障害類似キャッシュ応答「キャッシュ応答」と表記
Staticすべて失敗定型メッセージ + 人間エスカレーション応答品質は最低限

サーキットブレーカーパラメータ

パラメータ根拠
エラー率閾値50%半数以上がエラーなら遮断
ウィンドウサイズ60秒一時的なエラーでの誤発動を防止
最小サンプル数10件統計的に有意な判断
OPEN状態の持続時間60秒短すぎるとフラッピング
HALF-OPEN時のテスト数3件復旧確認の信頼性

Mission 3: セキュリティ設計

要件

  1. APIキー管理アーキテクチャを設計
  2. PII保護方針をCS-AIに対して策定
  3. 監査ログ設計(記録項目、保持期間、アクセス制御)
  4. プロンプトインジェクション対策の実装方針
解答例

PII保護方針(CS-AI)

段階対策実装方法
入力時ユーザー入力からPII検出正規表現 + Presidio(OSS)
送信前PIIをプレースホルダに置換[EMAIL] → masked@example.com
ログ保存マスキング済みログのみ保存Langfuseへの送信前にマスキング
出力時応答内のPII検出・マスキング出力フィルタで再チェック

監査ログ設計

カテゴリ記録項目保持期間アクセス権限
リクエストログサービス、ユーザー、モデル、トークン数、コスト1年LLMOps + SRE
セキュリティイベントインジェクション検出、PII検出、異常アクセス3年セキュリティ + LLMOps
設定変更プロンプト変更、権限変更、モデル変更3年全エンジニア(読取専用)

達成度チェック

観点達成基準
アーキテクチャ3サービスの統合構成図が明確で、将来の拡張を考慮している
フォールバック4段階以上のフォールバックチェーンが各サービスに定義されている
セキュリティPII保護、インジェクション対策、監査ログの3領域をカバーしている
実現性予算制約(月10万円)と可用性目標を踏まえた現実的な設計

推定所要時間: 90分