EXERCISE 60分

佐藤CTOからの指令:「月間クラウドコストが$80,000に達している。6ヶ月で30%削減する計画を策定してほしい。ただし、パフォーマンスとサービスレベルは維持すること。」

#ミッション難易度目安時間
1コスト分析と改善点の特定★★☆15分
2Right-sizing と Savings Plans設計★★★15分
3アーキテクチャレベルの最適化★★★15分
4FinOps運用計画★★☆15分

Mission 1: コスト分析と改善点の特定

以下のコスト構成を分析し、削減可能な項目を特定せよ。

月間コスト: $80,000
内訳:
  EC2 (Web/API): $28,000 (35%) - c5.2xlarge × 20台 (全オンデマンド)
  RDS: $12,000 (15%) - r5.4xlarge × 3台 (全オンデマンド)
  ElastiCache: $4,000 (5%) - r5.xlarge × 3ノード
  NAT Gateway: $8,000 (10%) - 大量のS3/DynamoDBアクセス
  Data Transfer: $6,000 (7.5%) - AZ間通信多数
  CloudWatch: $5,000 (6.3%) - 全ログを30日保持
  EBS: $4,000 (5%) - 未使用スナップショット多数
  S3: $3,000 (3.8%) - ライフサイクルポリシー未設定
  その他: $10,000 (12.5%)
解答例
項目現在改善策削減額
EC2$28,000Savings Plans(70%) + Graviton移行-$14,000
RDS$12,000Reserved Instances + Graviton-$5,000
NAT Gateway$8,000VPCエンドポイント追加-$6,000
CloudWatch$5,000ログ保持期間7日 + S3エクスポート-$3,500
EBS$4,000未使用スナップショット削除-$2,500
S3$3,000ライフサイクルポリシー + Glacier-$1,500
Data Transfer$6,000VPCエンドポイント + AZ最適化-$2,000
合計$80,000-$34,500 (43%削減)

Mission 2: Right-sizing と Savings Plans設計

EC2とRDSのRight-sizingとSavings Plans購入計画を策定せよ。

解答例
■ EC2 Right-sizing
  現在: c5.2xlarge × 20台 (平均CPU 35%, Memory 40%)
  → c5.xlarge × 20台 にダウンサイズ(CPU/Memory半減で十分)
  → さらに c6g.xlarge(Graviton)に移行で20%削減
  コスト: $28,000 → $11,200 (60%削減)

■ Savings Plans
  ベースライン: 15台分をCompute Savings Plans (3年, Partial Upfront)
  変動分: 5台分はオンデマンド(ピーク時のスケール用)
  → 15台 × $0.085/h × 730h = $930/月 (割引後)
  → 5台 × $0.17/h × 730h × 50% = $310/月 (平均稼働50%)
  → 合計 $1,240/月 → 年$14,880

■ RDS
  現在: r5.4xlarge × 3台
  → Read Replica 2台は r6g.2xlarge にダウンサイズ + Graviton
  → Primary は r6g.4xlarge (Graviton移行)
  → 3台とも Reserved Instances (1年)
  コスト: $12,000 → $5,500 (54%削減)

Mission 3: アーキテクチャレベルの最適化

NAT GatewayとData Transferのコストを削減するアーキテクチャ改善を設計せよ。

解答例
■ NAT Gateway ($8,000 → $2,000)
  原因: Private SubnetからS3/DynamoDBへのアクセスがNAT経由
  対策:
    1. S3 Gateway Endpoint追加(無料)→ S3通信がNATを経由しなくなる
    2. DynamoDB Gateway Endpoint追加(無料)
    3. ECR/CloudWatch/STS用のInterface Endpoint追加($7/月/AZ)
  → NAT通過トラフィック 80%削減

■ Data Transfer ($6,000 → $4,000)
  原因: マイクロサービス間のAZ跨ぎ通信
  対策:
    1. 同一AZ優先ルーティング(Service Mesh設定)
    2. gRPC + Protocol Buffers(JSONからの変換でペイロード削減)
    3. レスポンスキャッシュ(同じデータの重複取得を排除)

Mission 4: FinOps運用計画

削減を持続的にするFinOps運用計画を設計せよ。

解答例
■ Phase 1: Inform(Month 1-2)
  - タグポリシーの策定と強制
  - チーム別コストダッシュボード構築
  - 週次コストレポートのSlack自動配信

■ Phase 2: Optimize(Month 3-4)
  - Right-sizing実行(EC2, RDS, ECS)
  - Savings Plans購入
  - VPCエンドポイント追加

■ Phase 3: Operate(Month 5-6)
  - Unit Economics追跡開始($/MAU)
  - コスト異常検知アラート設定
  - 月次コストレビュー会議の定例化
  - チームOKRにコスト効率を追加

■ KPI
  - 月間コスト: $80,000 → $56,000以下
  - Savings Plansカバレッジ: 0% → 70%以上
  - タグカバレッジ: 60% → 95%以上
  - Unit Economics: $/MAU を月次追跡