EXERCISE 60分

ストーリー

田中VPoE
SREのスキルセット、採用戦略、育成プログラムを学んだ。これらを統合して、18ヶ月間のSREチーム構築ロードマップを策定してもらう
あなた
採用と育成を組み合わせた現実的な計画ですね
田中VPoE
そうだ。予算制約、採用市場の現実、既存チームのモチベーション — すべてを考慮した計画が必要だ。そして、各マイルストーンでチームが何を達成できる状態になるかを明確にしてほしい
あなた
マイルストーンごとのケイパビリティも定義します
田中VPoE
完璧だ。CTOに提出する計画書として、十分な説得力を持つものにしてくれ

ミッション概要

項目内容
演習タイトルSREチーム構築計画の策定
想定時間60分
成果物18ヶ月SREチーム構築ロードマップ

前提条件

項目内容
現在のSRE人員0名(運用チーム8名は転換候補)
年間採用予算新規採用2名/年(SREポジション)
育成予算1人あたり50万円/年(研修、書籍、カンファレンス)
外部コンサルタント予算500万円/年

Mission 1: 18ヶ月ロードマップ

要件

以下を含むSREチーム構築ロードマップを策定してください。

  1. 3フェーズの計画: 各6ヶ月の目標と主要活動
  2. 人員計画: 採用と育成のタイムライン
  3. マイルストーン: 各フェーズ終了時のケイパビリティ
  4. リスクと対策: 計画遂行上のリスク3つ以上
解答例

Phase 1: 基盤構築(0-6ヶ月)

人員アクション主要活動
1SREリード採用開始、コンサルタント契約SRE戦略策定、ツール選定
2SREリード着任(想定)SLI/SLO設計、運用チーム研修開始
3SREエンジニア採用開始主要3サービスのSLO導入
4運用チーム Phase1研修完了エラーバジェットポリシー策定
5SREエンジニア着任(想定)オンコール体制構築
6コンサルタント契約終了判断ポストモーテムプロセス確立

Phase 1終了時のケイパビリティ:

  • 主要3サービスのSLI/SLO稼働
  • オンコール体制でSREチーム(4名以上)が対応可能
  • ポストモーテムプロセスが確立

Phase 2: 拡大(6-12ヶ月)

人員アクション主要活動
7運用チーム Phase2研修完了全サービスのSLO導入
8-エラーバジェットダッシュボード構築
9追加採用の判断開発チームへのSRE文化コンサルティング開始
10-自動化プロジェクト推進
11運用チーム Phase3完了(卒業評価)ゲームデイの定期実施
12-Phase 2振り返り、Phase 3計画策定

Phase 2終了時のケイパビリティ:

  • 全サービスのSLO稼働、エラーバジェットポリシー運用中
  • 運用チーム8名中6名以上がSREスキルL2に到達
  • トイル率50%以下を達成

Phase 3: 成熟(12-18ヶ月)

人員アクション主要活動
13-開発チームのオンコール参加開始(シャドーイング)
14-SREプラットフォームの内製化
15次年度採用計画策定ハイブリッド型組織への移行準備
16-開発チーム独立対応の段階的移行
17-SRE組織の成熟度評価
18-2年目の戦略策定、成果報告

Phase 3終了時のケイパビリティ:

  • ハイブリッド型SRE組織への移行完了
  • 一部の開発チームが自律的にSREプラクティスを実行
  • SRE組織のROIが数値で実証されている

リスクと対策

リスク影響確率対策
SREリード採用の長期化計画全体が3-6ヶ月遅延コンサルタントで初期を代行、採用条件の柔軟化
運用チームの離職育成投資の損失早期にSREキャリアパスと報酬改善を提示
経営層のコミットメント低下予算削減、優先度低下3ヶ月ごとのROI報告、クイックウィンの創出
SRE文化への抵抗プロセスが形骸化小さな成功の積み重ね、チャンピオンの育成

Mission 2: スキルマトリクスと育成計画

要件

SREチーム全メンバーのスキルマトリクスと個別育成計画を策定してください。

  1. 現状スキル評価: 各メンバーの現在のスキルレベル(想定)
  2. 6ヶ月後目標: 各スキルの目標レベル
  3. 育成施策: 各メンバーごとの具体的な育成アクション
  4. 評価方法: スキル向上の評価基準
解答例

スキルマトリクス(現状→6ヶ月後目標)

メンバープログラミング可観測性SLI/SLOインシデント管理自動化
SREリードL4L3L4L4L3
SREエンジニアL3L3→L4L3L3L3→L4
プラットフォームAL1→L2L2→L3L1→L2L2→L3L1→L2
プラットフォームBL1→L2L2L1→L2L2L1→L2
プラットフォームCL1L1→L2L1L1→L2L1
可観測性AL1→L2L3L1→L2L2→L3L2
可観測性BL1→L2L3L1→L2L2L2
インフラAL2L2→L3L1→L2L2→L3L2→L3
インフラBL1→L2L2L1→L2L2L1→L2
インフラCL2L2L1→L2L2L2→L3

個別育成計画(例: プラットフォームA)

育成テーマ具体的なアクション評価
1SRE基礎SRE研修受講、Google SRE本読了理解度テスト
2プログラミングPython基礎コース + 自動化スクリプト作成コードレビュー
3可観測性実践Grafanaダッシュボード構築成果物評価
4SLI/SLO担当サービスのSLI設計設計レビュー
5オンコールシャドーイング開始観察評価
6総合ゲームデイでの実技評価合否判定

達成度チェック

観点達成基準
ロードマップ18ヶ月の3フェーズ計画が現実的に設計されている
人員計画採用と育成の両方を考慮した人員計画がある
マイルストーン各フェーズのケイパビリティが明確に定義されている
リスク管理主要なリスクと対策が識別されている
スキル育成個別の育成計画と評価基準が定義されている

推定所要時間: 60分