ストーリー
田
田中VPoE
成熟度モデル、文化アセスメント、DORAメトリクス — 評価の道具立ては揃った。ここからは実践だ。架空の組織シナリオを使って、DevOps成熟度アセスメントを一通り実施してもらう
あなた
総合的なアセスメントですね。どういった組織が対象ですか
あ
田
田中VPoE
中堅のEC企業だ。DevOpsツールは一通り導入済みだが、「文化が変わらない」と悩んでいる。まさに今回のミッションのど真ん中だ。彼らの現在地を正確に評価し、改善の方向性を提言してくれ
ミッション概要
| 項目 | 内容 |
|---|
| 演習タイトル | DevOps成熟度アセスメントの実施 |
| 想定時間 | 60分 |
| 成果物 | DevOps成熟度アセスメントレポート(7軸評価 + Westrum診断 + DORAメトリクス分析 + 改善提言) |
| 対象組織 | 中堅EC企業(社員300名、うち開発120名) |
前提条件
組織の概要
会社概要:
会社名: NetShop株式会社(架空)
事業: BtoC EC(アパレル・雑貨のオンラインストア)
社員数: 300名
開発部門: 120名
売上: 年間200億円
月間アクティブユーザー: 500万人
設立: 2012年
技術スタック:
フロントエンド: React + Next.js
バックエンド: Java (Spring Boot) + Go (一部マイクロサービス)
インフラ: AWS (ECS, RDS, ElastiCache, CloudFront)
CI/CD: Jenkins (レガシー) + GitHub Actions (新規)
モニタリング: Datadog
IaC: Terraform (一部), 手動構築も残る
コミュニケーション: Slack, Confluence
組織構造:
CTO
├── 開発部(80名)
│ ├── EC基盤チーム(20名)← モノリス中心
│ ├── 商品チーム(15名)
│ ├── 決済チーム(12名)
│ ├── 検索・レコメンドチーム(10名)
│ ├── モバイルチーム(13名)
│ └── フロントエンドチーム(10名)
├── インフラ部(25名)
│ ├── SREチーム(8名)
│ ├── ネットワーク・セキュリティチーム(7名)
│ └── DBA(4名)+ クラウドインフラ(6名)
└── QA部(15名)← 独立した組織
DevOps関連の現状データ
DORAメトリクス(直近6ヶ月の平均):
| メトリクス | EC基盤チーム | 商品チーム | 決済チーム | 検索チーム | モバイル |
|---|
| デプロイ頻度 | 月2回 | 週1回 | 月1回 | 週2回 | 2週に1回 |
| 変更リードタイム | 14日 | 5日 | 21日 | 3日 | 10日 |
| 変更障害率 | 25% | 15% | 30% | 10% | 20% |
| MTTR | 4時間 | 2時間 | 8時間 | 1時間 | 6時間 |
文化サーベイ結果(全社平均、7段階):
| 項目 | スコア |
|---|
| 情報共有が活発に行われている | 3.8 |
| 失敗やミスから学ぶ姿勢がある | 3.2 |
| 新しいアイデアが歓迎される | 4.1 |
| チーム間の協力は自発的に行われる | 2.9 |
| 問題を報告する人は評価される | 3.0 |
| リスクを取ることが奨励されている | 3.5 |
| 部門間の対立は建設的に解決される | 2.7 |
インタビュー抜粋:
| 発言者 | コメント |
|---|
| EC基盤チームリーダー | 「Jenkinsのパイプラインが複雑化していて誰もメンテしたくない。でも動いているから触れない」 |
| SREチームリーダー | 「開発チームがデプロイしたあと、障害の対応はうちに丸投げされる。共同責任なんて名ばかり」 |
| 商品チームメンバー | 「GitHub Actionsに移行してからデプロイが楽になった。でも他チームはまだJenkins」 |
| QA部長 | 「リリース前のテストフェーズが2週間。自動テストが不十分なので手動テストが必須」 |
| 決済チームリーダー | 「セキュリティと変更承認のプロセスが重くて、簡単な修正でも1週間かかる」 |
| CTO | 「DevOpsツールには投資した。でも本番障害は減らないし、リリーススピードも上がらない」 |
| 開発メンバーA | 「ポストモーテムはやるけど、いつも同じ結論。で、アクションアイテムは放置される」 |
| インフラメンバーB | 「Terraformはあるが、緊急時にコンソールから直接変更する人がいて、ドリフトが発生する」 |
Mission 1: 7軸成熟度評価の実施
要件
前提条件の情報をもとに、NetShop社のDevOps成熟度を7軸で評価してください。
- 7軸それぞれのスコア(Level 1-5)と根拠
- レーダーチャートの概形(テキストで表現)
- 最も成熟している軸と最も遅れている軸の特定
解答例
7軸評価
| 評価軸 | レベル | 根拠 |
|---|
| CI/CD | 2 | Jenkins(レガシー)とGitHub Actions(新規)が混在。一部チームで自動化が進んでいるが全社標準化はされていない |
| インフラ管理 | 2 | Terraform導入済みだが、手動変更が残る。緊急時のコンソール直接変更でドリフト発生 |
| モニタリング | 3 | Datadogを全社導入。ただしSLI/SLOの定義がチームによってまちまちと推測 |
| コラボレーション | 2 | SREチームへの障害対応「丸投げ」が常態化。QA部が独立組織で開発とのサイロあり |
| 学習と改善 | 1 | ポストモーテムは実施するが形骸化。アクションアイテムが放置される |
| セキュリティ | 2 | 決済チームに重い変更承認プロセスがある。ただしシフトレフトされておらずスピードとの矛盾 |
| ガバナンス | 2 | 変更管理プロセスは存在するが、チームごとにバラバラ。統一的なガバナンスフレームワークなし |
最も成熟: モニタリング(Level 3)
最も遅れ: 学習と改善(Level 1)
Mission 2: Westrum組織文化診断
要件
文化サーベイ結果とインタビュー抜粋を分析し、以下を作成してください。
- Westrum組織類型の判定(スコアと根拠)
- 5つの文化次元の評価(心理的安全性、学習志向、共同責任、継続的改善、顧客志向)
- サーベイ結果とインタビュー発言の乖離点の指摘
解答例
Westrum組織類型
平均スコア: 3.3 → 官僚的(Bureaucratic)
| 項目 | スコア | 分析 |
|---|
| 情報共有 | 3.8 | 中程度。Slackは使っているが、チーム間の壁がある |
| 失敗から学ぶ | 3.2 | 低め。ポストモーテムが形骸化していることと整合 |
| 新しいアイデア | 4.1 | 比較的良好。ただしチームによって差が大きいと推測 |
| チーム間協力 | 2.9 | 低い。SREの「丸投げ」発言と整合 |
| 問題報告の評価 | 3.0 | 低い。問題を報告しても「犯人探し」になる兆候 |
| リスクの奨励 | 3.5 | 中程度。一部チーム(検索)は実験的、他は保守的 |
| 対立の解決 | 2.7 | 最低スコア。部門間の対立が建設的に解決されていない |
5つの文化次元
| 次元 | 評価 | 根拠 |
|---|
| 心理的安全性 | 低〜中 | 問題報告の評価が3.0。犯人探しの文化が残っている可能性 |
| 学習志向 | 低 | ポストモーテムの形骸化、アクションアイテムの放置 |
| 共同責任 | 低 | SREへの丸投げ、QA独立組織によるサイロ |
| 継続的改善 | 低 | Jenkins問題の放置(「動いているから触れない」) |
| 顧客志向 | 中 | EC事業なので顧客指標は意識しているが、内部プロセスの議論が中心 |
サーベイとインタビューの乖離
- 「新しいアイデアが歓迎される」(4.1)は比較的高いが、「動いているから触れない」という発言と矛盾。アイデアは歓迎されるが実行に移されない可能性がある
Mission 3: 統合分析と改善提言
要件
Mission 1と2の結果を統合し、以下を作成してください。
- DORAメトリクスの全社分析(チーム間のばらつきと全社平均の判定)
- 成熟度 × 文化 × DORAの統合分析(3つの評価の相関)
- 優先度付き改善提言(短期・中期・長期の3フェーズ)
解答例
DORAメトリクス全社分析
| メトリクス | 全社平均 | 判定 | チーム間ばらつき |
|---|
| デプロイ頻度 | 約週1回 | Medium | 大きい(月1回〜週2回) |
| 変更リードタイム | 約10日 | Medium | 大きい(3日〜21日) |
| 変更障害率 | 約20% | Medium | 中程度(10%〜30%) |
| MTTR | 約4時間 | High | 大きい(1時間〜8時間) |
全社判定: Medium(ただしチーム間のばらつきが最大の課題)
統合分析
| 観点 | 分析 |
|---|
| 技術 vs 文化のギャップ | モニタリング(L3)は技術投資で進んでいるが、学習と改善(L1)が追いついていない。典型的な「ツール先行・文化遅延」パターン |
| DORAとWestrumの相関 | 検索チーム(DORA最良)はWestrumの「新しい試み」が高いと推測。決済チーム(DORA最悪)は重いガバナンスプロセスがボトルネック |
| 最大のボトルネック | コラボレーション(L2)と学習文化(L1)の低さがDORA全指標を制約している |
改善提言
| フェーズ | 期間 | 施策 | 期待効果 |
|---|
| 短期 | 0-3ヶ月 | ブレームレスポストモーテムの再設計とアクションアイテム追跡の仕組み化 | 学習文化の立ち上げ(L1→L2) |
| 短期 | 0-3ヶ月 | 検索チームの成功パターンを他チームへ共有するショーケース開催 | チーム間ばらつきの縮小 |
| 中期 | 3-6ヶ月 | SREと開発チームの共同オンコール体制構築(Shared ownership) | コラボレーション改善(L2→L3) |
| 中期 | 3-6ヶ月 | CI/CDパイプラインの全社標準化(Jenkins→GitHub Actions移行) | CI/CD成熟度向上(L2→L3) |
| 長期 | 6-12ヶ月 | 全チームでのDORAメトリクス計測と文化サーベイの定期実施 | データ駆動の継続的改善サイクル確立 |
達成度チェック
| 観点 | 達成基準 |
|---|
| 7軸評価 | 各軸にエビデンスに基づくレベル判定と根拠がある |
| Westrum診断 | サーベイスコアとインタビュー発言を統合した分析がある |
| DORA分析 | チーム間のばらつきを把握し、全社平均の判定が妥当 |
| 統合分析 | 3つの評価結果を横断的に分析し、相関を見出している |
| 改善提言 | 優先度とフェーズが明確で、実行可能な施策が提示されている |
推定所要時間: 60分