LESSON 30分

ストーリー

田中VPoE
ブレイムレス文化、ポストモーテム、学習する組織 — 理論は揃った。だが、これらを「仕組み」として動かさないと絵に描いた餅だ
あなた
具体的にどう仕組み化するんですか?
田中VPoE
失敗を「隠すもの」から「共有するもの」に、そして「組織の財産」に変えるための仕組みだ。Spotifyには「Fail Wall」、Pixarには「Braintrust」、Etsyには「Three-Armed Sweater」(うまくいかなかった施策に名前をつけて愛でる文化)がある
あなた
失敗に名前をつけて愛でるって、すごい発想ですね
田中VPoE
失敗を恥や罰の対象から、組織の学びと誇りの対象に変える。それが文化の力だ。今日はその具体的な仕組みを設計しよう

失敗共有の全体像

失敗を財産に変えるパイプライン

失敗の発生
  → 即座の報告(心理的安全性)
  → ポストモーテム(構造的分析)
  → 学びの抽出(一般化)
  → 全社共有(横展開)
  → 仕組みへの反映(制度化)
  → 新メンバーへの伝承(文化化)
ステージ目的必要な仕組み
報告失敗を隠さず即座に報告するインシデント報告チャンネル、報告テンプレート
分析構造的な原因を特定するブレイムレスポストモーテム
共有学びを組織全体に広げる失敗共有会、ニュースレター、カタログ
反映学びをプロセス・ツールに組み込むチェックリスト更新、自動化、ガードレール
伝承新メンバーに組織の知恵を伝えるオンボーディング、失敗事例集

失敗共有の仕組み:3つのレイヤー

レイヤー1: リアルタイム共有

仕組み実装方法ポイント
インシデントチャンネルSlackに#incident専用チャンネルを開設報告テンプレートをピン留め、報告のハードルを下げる
ニアミス報告大事に至らなかった「ヒヤリハット」も報告重大インシデントの予兆をキャッチする
Fail Botインシデント報告をSlack Botで自動収集・集計報告の手間を最小化する

ニアミス報告の重要性

ハインリッヒの法則:

  1件の重大事故
  ├── 29件の軽微な事故
  └── 300件のニアミス(ヒヤリハット)

→ 重大事故を防ぐには、300件のニアミスから学ぶことが最も効果的
→ ニアミスを報告しやすい文化が、重大障害の予防につながる

レイヤー2: 定期的な共有イベント

イベント頻度形式内容
Failure Friday毎週金曜30分のLT形式今週の失敗と学びを気軽に共有
月次ポストモーテム共有会月1回60分のプレゼン形式月間の主要インシデントのポストモーテムを深掘り
四半期失敗レビュー四半期1回90分のワークショップ形式四半期のインシデントトレンドを分析、構造的改善を議論
年次Fail Conference年1回半日のカンファレンス形式年間の最大の失敗と学びを全社で振り返る

Failure Fridayの運営ガイド

要素設計
時間毎週金曜 16:00-16
形式LT 5分 x 3名 + Q&A 15分
発表者立候補 or 指名(持ち回り)
ルールブレイムレス、質問は「学び」にフォーカス
記録発表内容をConfluenceに記録
インセンティブ月間ベストフェイル賞の候補にノミネート

レイヤー3: ナレッジアーカイブ

仕組み内容運用方法
失敗パターンカタログ頻出する失敗パターンとその対策を体系化カテゴリ別(DB、API、デプロイ等)に整理
ポストモーテムアーカイブ過去のポストモーテムを全社公開で蓄積タグ付き、検索可能、定期レビュー
改善事例データベース失敗から生まれた改善の成功事例を蓄積Before/After形式で効果を可視化
オンボーディング教材新メンバー向けに「組織が学んだこと」を伝える入社1週目に主要な失敗事例を学ぶ

失敗パターンカタログの設計

カタログの構造

セクション内容
パターン名覚えやすい名前(例: 「金曜デプロイの罠」)
分類カテゴリとタグ
症状どのような形で現れるか
根本原因なぜこのパターンが起きるか
防御策どうすれば防げるか
発生事例実際に起きたインシデントへのリンク
検知方法このパターンが起きている兆候

カタログの例

パターン名分類症状防御策
金曜デプロイの罠デプロイ金曜夕方のデプロイ後に週末障害金曜午後のデプロイを禁止するルール
設定値の転記ミス設定管理手動で転記した設定値が間違っているInfrastructure as Codeで設定を自動管理
N+1クエリの見落としパフォーマンス開発環境では問題なく本番で遅延APMツールでのN+1検出を自動化
暗黙の依存関係アーキテクチャサービスAの変更でサービスBが壊れる依存関係マップの自動生成と影響分析
楽観的見積もりプロジェクト管理予定通りに終わらないプロジェクト過去の実績に基づいた見積もり補正

失敗を語る文化の醸成

リーダーが率先して失敗を語る

アクション効果実践方法
VPoEの失敗談を全社共有「リーダーも失敗する」というメッセージ四半期の全社会で自身の失敗と学びを発表
マネージャーの「今週の失敗」チーム内の心理的安全性向上週次1on1で自身の失敗から話し始める
「失敗しない人は挑戦していない」の浸透挑戦する文化の醸成評価面談で「挑戦した失敗」を積極的に評価

失敗を語る言語の設計

従来の表現新しい表現効果
「障害」「事故」「学習機会」「改善のきっかけ」ネガティブなイメージを軽減
「原因者」「犯人」「関係者」「当事者」個人攻撃のニュアンスを排除
「失敗した」「実験の結果、想定と異なった」失敗を実験の一部として位置づける
「二度と起こさない」「次に同じ状況で、より良い選択ができるようにする」完璧主義から成長志向へ

失敗共有の効果測定

指標測定方法目標
インシデント報告数インシデントチャンネルの投稿数月次で増加傾向(報告文化の浸透)
ニアミス報告数ヒヤリハット報告の件数インシデントの10倍以上
ポストモーテム実施率対象インシデントのうちPM実施の割合100%
アクションアイテム完了率PMで決めたアクションの実行割合90%以上
同一原因の再発率同じパターンの障害が再度発生した割合四半期ごとに低下
Failure Friday参加率全エンジニアに対する参加割合50%以上

まとめ

ポイント内容
パイプライン報告 → 分析 → 共有 → 反映 → 伝承
3つのレイヤーリアルタイム共有、定期イベント、ナレッジアーカイブ
失敗パターンカタログ頻出する失敗パターンを体系化して再利用可能にする
リーダーの役割率先して失敗を語り、心理的安全性を示す
言語の設計失敗を語る言葉自体を変えることで文化を変える

チェックリスト

  • 失敗を財産に変えるパイプラインを理解した
  • 3つのレイヤー(リアルタイム、定期、アーカイブ)の仕組みを把握した
  • 失敗パターンカタログの設計方法を理解した
  • リーダーが率先する重要性を認識した
  • 失敗を語る言語の設計について理解した

次のステップへ

次は演習です。ブレイムレスカルチャー、ポストモーテム、学習する組織、失敗共有の仕組みを統合した「失敗学習文化設計書」を作成しましょう。


推定読了時間: 30分