EXERCISE 60分

ストーリー

田中VPoE
運用自動化の理論を学んだ。ここからは、組織のCI/CD基盤の運用自動化を具体的に設計してもらう
田中VPoE
プラットフォームチーム5人で20チームをサポートするには、手動作業を極限まで減らす必要がある。どこを自動化すれば最大の効果が得られるか、優先順位をつけて設計してくれ
あなた
わかりました。ROIを意識して設計します

ミッション概要

ミッションテーマ目安時間
Mission 1自動化対象の優先順位付け15分
Mission 2IaC設計15分
Mission 3自己修復とセルフサービス設計15分
Mission 4運用自動化設計書統合15分

前提条件

プラットフォームチームの現状:
- 5名のエンジニア
- 週の40%が手動作業(リクエスト対応、トラブルシューティング)
- 残り60%が開発(共有ライブラリ、ツール開発)

主要な手動作業(週あたり):
- 新プロジェクトのCI/CDセットアップ: 3件 × 2時間 = 6時間
- ランナーの手動スケーリング: 5回 × 30分 = 2.5時間
- セキュリティパッチの適用: 2回 × 3時間 = 6時間
- コンプライアンスレポート作成: 月1回 × 16時間 = 4時間/週
- トラブルシューティング: 10件 × 1時間 = 10時間
- 合計: 約28.5時間/週(5人×40時間の約14%を手動作業)

目標: 手動作業を週10時間以内に削減

Mission 1: 自動化対象の優先順位付け(15分)

要件

現在の手動作業をROI順にランク付けし、自動化計画を策定してください。

解答例
優先順位手動作業週あたり工数自動化方法削減見込み
1新プロジェクトのセットアップ6hテンプレートリポジトリ + セルフサービス5.5h削減
2ランナーのスケーリング2.5hARC自動スケーリング2h削減
3セキュリティパッチ適用6hDependabot + 自動マージ4h削減
4コンプライアンスレポート4h自動レポート生成3.5h削減
5トラブルシューティング10h自己修復 + Runbook自動化5h削減

削減見込み合計: 20h/週 → 手動作業は8.5h/週に削減


Mission 2: IaC設計(15分)

要件

CI/CD基盤のIaC管理体制を設計してください。リポジトリ構成、変更管理フロー、テスト戦略を含めること。

解答例

リポジトリ構成:

org/platform-infrastructure/
├── terraform/
│   ├── github/          # GitHub Organization設定
│   ├── runners/         # ランナー基盤(EKS + ARC)
│   ├── monitoring/      # 監視基盤(Grafana, Prometheus)
│   └── secrets/         # シークレット管理(Vault)
├── kubernetes/
│   ├── base/            # 共通マニフェスト
│   └── overlays/        # 環境別オーバーレイ
└── scripts/
    ├── drift-check.sh   # ドリフト検知
    └── cleanup.sh       # リソースクリーンアップ

変更管理フロー:

  1. PRで変更を提案 → Terraform Plan自動実行
  2. プラットフォームチーム2名以上のレビュー
  3. PRマージ → Terraform Apply自動実行
  4. スモークテスト自動実行
  5. 異常検知時はアラート発報 + 自動ロールバック

Mission 3: 自己修復とセルフサービス設計(15分)

要件

自己修復ルールとセルフサービスポータルの設計を行ってください。

解答例

自己修復ルール:

障害パターン検知方法自動修復エスカレーション条件
ランナー応答なしHealth CheckPod再起動3回連続失敗
ビルドキュー滞留メトリクス > 5min追加ランナー起動30分以上改善なし
キャッシュ破損ヒット率 < 50%キャッシュ再構築24時間以内に改善なし
GitHub API制限429レスポンスリトライ + バックオフ1時間以上制限継続

セルフサービスメニュー:

操作方法承認SLA
新リポジトリ作成Slack Bot → テンプレート選択自動即時
環境追加PR → Terraformチームリード1営業日
シークレット追加GitHub UIチームリード即時
ランナーラベル追加PR → ARC設定プラットフォームチーム1営業日

Mission 4: 運用自動化設計書統合(15分)

要件

Mission 1-3の成果を統合した運用自動化設計書を作成してください。

解答例
# CI/CD基盤 運用自動化設計書

## 1. 自動化戦略
- 手動作業を週28.5h → 8.5hに削減
- ROI順に5つの自動化施策を実施

## 2. Infrastructure as Code
- Terraform + Kubernetesで基盤全体を管理
- GitOpsフローで変更管理
- 6時間ごとのドリフト検知

## 3. 自己修復
- ランナー、キャッシュ、設定ドリフトの自動修復
- エスカレーション条件を明確化

## 4. セルフサービス
- 4つの操作をセルフサービス化
- Slack Bot + PR + GitHub UIの3チャネル

## 5. 期待効果
- プラットフォームチームの開発時間: 60% → 80%
- チームの待ち時間: 平均2日 → 即時〜1営業日

達成度チェック

ミッションテーマ完了
Mission 1自動化優先順位付け
Mission 2IaC設計
Mission 3自己修復/セルフサービス
Mission 4設計書統合

まとめ

ポイント内容
自動化ROIに基づく優先順位付けで手動作業を大幅削減
IaCGitOpsフローで基盤変更を安全に管理
自己修復障害の自動検知・修復でプラットフォームチームの負荷軽減
セルフサービスチームの自律性を高め、待ち時間を削減

チェックリスト

  • 手動作業のROI分析と優先順位付けができた
  • CI/CD基盤のIaC管理体制を設計できた
  • 自己修復とセルフサービスの設計ができた

次のステップへ

次はチェックポイントクイズです。運用自動化の理解度を確認しましょう。


推定読了時間: 60分