佐藤CTOからの指令:「月間クラウドコストが$80,000に達している。6ヶ月で30%削減する計画を策定してほしい。ただし、パフォーマンスとサービスレベルは維持すること。」
| # | ミッション | 難易度 | 目安時間 |
|---|---|---|---|
| 1 | コスト分析と改善点の特定 | ★★☆ | 15分 |
| 2 | Right-sizing と Savings Plans設計 | ★★★ | 15分 |
| 3 | アーキテクチャレベルの最適化 | ★★★ | 15分 |
| 4 | FinOps運用計画 | ★★☆ | 15分 |
Mission 1: コスト分析と改善点の特定
以下のコスト構成を分析し、削減可能な項目を特定せよ。
月間コスト: $80,000
内訳:
EC2 (Web/API): $28,000 (35%) - c5.2xlarge × 20台 (全オンデマンド)
RDS: $12,000 (15%) - r5.4xlarge × 3台 (全オンデマンド)
ElastiCache: $4,000 (5%) - r5.xlarge × 3ノード
NAT Gateway: $8,000 (10%) - 大量のS3/DynamoDBアクセス
Data Transfer: $6,000 (7.5%) - AZ間通信多数
CloudWatch: $5,000 (6.3%) - 全ログを30日保持
EBS: $4,000 (5%) - 未使用スナップショット多数
S3: $3,000 (3.8%) - ライフサイクルポリシー未設定
その他: $10,000 (12.5%)
解答例
| 項目 | 現在 | 改善策 | 削減額 |
|---|---|---|---|
| EC2 | $28,000 | Savings Plans(70%) + Graviton移行 | -$14,000 |
| RDS | $12,000 | Reserved Instances + Graviton | -$5,000 |
| NAT Gateway | $8,000 | VPCエンドポイント追加 | -$6,000 |
| CloudWatch | $5,000 | ログ保持期間7日 + S3エクスポート | -$3,500 |
| EBS | $4,000 | 未使用スナップショット削除 | -$2,500 |
| S3 | $3,000 | ライフサイクルポリシー + Glacier | -$1,500 |
| Data Transfer | $6,000 | VPCエンドポイント + AZ最適化 | -$2,000 |
| 合計 | $80,000 | -$34,500 (43%削減) |
Mission 2: Right-sizing と Savings Plans設計
EC2とRDSのRight-sizingとSavings Plans購入計画を策定せよ。
解答例
■ EC2 Right-sizing
現在: c5.2xlarge × 20台 (平均CPU 35%, Memory 40%)
→ c5.xlarge × 20台 にダウンサイズ(CPU/Memory半減で十分)
→ さらに c6g.xlarge(Graviton)に移行で20%削減
コスト: $28,000 → $11,200 (60%削減)
■ Savings Plans
ベースライン: 15台分をCompute Savings Plans (3年, Partial Upfront)
変動分: 5台分はオンデマンド(ピーク時のスケール用)
→ 15台 × $0.085/h × 730h = $930/月 (割引後)
→ 5台 × $0.17/h × 730h × 50% = $310/月 (平均稼働50%)
→ 合計 $1,240/月 → 年$14,880
■ RDS
現在: r5.4xlarge × 3台
→ Read Replica 2台は r6g.2xlarge にダウンサイズ + Graviton
→ Primary は r6g.4xlarge (Graviton移行)
→ 3台とも Reserved Instances (1年)
コスト: $12,000 → $5,500 (54%削減)
Mission 3: アーキテクチャレベルの最適化
NAT GatewayとData Transferのコストを削減するアーキテクチャ改善を設計せよ。
解答例
■ NAT Gateway ($8,000 → $2,000)
原因: Private SubnetからS3/DynamoDBへのアクセスがNAT経由
対策:
1. S3 Gateway Endpoint追加(無料)→ S3通信がNATを経由しなくなる
2. DynamoDB Gateway Endpoint追加(無料)
3. ECR/CloudWatch/STS用のInterface Endpoint追加($7/月/AZ)
→ NAT通過トラフィック 80%削減
■ Data Transfer ($6,000 → $4,000)
原因: マイクロサービス間のAZ跨ぎ通信
対策:
1. 同一AZ優先ルーティング(Service Mesh設定)
2. gRPC + Protocol Buffers(JSONからの変換でペイロード削減)
3. レスポンスキャッシュ(同じデータの重複取得を排除)
Mission 4: FinOps運用計画
削減を持続的にするFinOps運用計画を設計せよ。
解答例
■ Phase 1: Inform(Month 1-2)
- タグポリシーの策定と強制
- チーム別コストダッシュボード構築
- 週次コストレポートのSlack自動配信
■ Phase 2: Optimize(Month 3-4)
- Right-sizing実行(EC2, RDS, ECS)
- Savings Plans購入
- VPCエンドポイント追加
■ Phase 3: Operate(Month 5-6)
- Unit Economics追跡開始($/MAU)
- コスト異常検知アラート設定
- 月次コストレビュー会議の定例化
- チームOKRにコスト効率を追加
■ KPI
- 月間コスト: $80,000 → $56,000以下
- Savings Plansカバレッジ: 0% → 70%以上
- タグカバレッジ: 60% → 95%以上
- Unit Economics: $/MAU を月次追跡