EXERCISE 90分

ストーリー

田中VPoE
ここまでの理論を実践に落とし込む。DevFlow社で新しいモニタリングツールを全社導入しようとしている中で、さまざまな抵抗に直面するシナリオを用意した
あなた
モニタリングツールの導入で抵抗が起きるんですか?
田中VPoE
ツールの導入は単なるきっかけだ。本質的には「今までのやり方を変える」ことへの抵抗だ。運用チームは既存ツールへの愛着がある。開発チームは新しい学習コストを嫌がる。マネージャーは予算と工数を心配する。3つのシナリオで、それぞれ異なる類型の抵抗を突破してもらう
あなた
実際の組織で起こりそうな状況ですね
田中VPoE
リアルに作ったつもりだ。正解は1つではない。だが、「論破する」「無視する」「上からの命令で従わせる」は不正解だ。相手を味方に変えるアプローチを考えてくれ

ミッション概要

項目内容
演習タイトル抵抗勢力対応シミュレーション
想定時間90分
成果物3つのシナリオへの対応計画(抵抗分析 + 対応戦略 + アクションプラン)
前提DevFlow社が全社統一モニタリングツール(Datadog)の導入を推進中。現状は各チームが独自のツール(Nagios、Zabbix、CloudWatch、自前スクリプト等)を使用

前提条件

現在の状況

モニタリングツール統一プロジェクトの背景:
  現状: 6チームが5種類のモニタリングツールを個別運用
  課題: 障害発生時にチーム横断の状況把握に平均40分
        アラート疲れ(1日平均200件、うち対応必要は15件)
        ツール維持の重複コスト年間1,200万円
  目標: Datadogに統一し、オブザーバビリティ基盤を構築
  効果: 障害検知時間50%短縮、アラートノイズ80%削減、コスト30%削減

推進体制:
  スポンサー: CTO佐藤
  推進リーダー: あなた
  テクニカルリード: SREチーム 鈴木

Mission 1: 運用チームリーダーの抵抗を分析する

シナリオ

運用チームリーダーの高橋さん(勤続15年、Nagiosのエキスパート)との1on1で、以下の発言がありました。

「Nagiosで10年間やってきた。障害を見逃したことは一度もない。Datadogなんて使ったこともないのに、なぜ変える必要があるのか。クラウドサービスに依存したら、Datadog自体が障害を起こしたときどうするんだ。うちのNagiosのカスタムプラグインは50個以上ある。これを全部移行するのに何ヶ月かかると思っているんだ。若い連中はすぐ新しいツールに飛びつくが、本当に安定運用できるのか。」

要件

  1. 抵抗の類型分析: 高橋さんの発言を類型別に分解し、表面の主張と本音を特定する
  2. 対話シナリオ: GROWモデルに基づいた1on1の会話を設計する
  3. アクションプラン: 高橋さんを「移行リーダー」に変えるための具体的なアクション3つ
解答例

抵抗の分析

要素内容
類型Type A(論理的反対)+ Type B(感情的反対)+ Type D(慣性的反対)
表面の主張Nagiosで問題なく運用できている。移行コストが大きい。クラウド依存リスク
本音15年間積み上げたスキルと実績が無価値になることへの恐れ。自分の存在意義の喪失
正当な懸念カスタムプラグイン50個の移行工数は実際に大きい。Datadog依存リスクも合理的
恐れコンピテンシーの喪失(自分が「初心者」に戻る)、チーム内での影響力低下

対話シナリオ(GROWモデル)

Goal:
  「高橋さん、運用チームとして理想的なモニタリング環境は
   どんなものですか?10年後を見据えて」
  → 長期的なビジョンを引き出す

Reality:
  「今のNagiosの運用で、正直に一番困っていることは何ですか?
   例えばマイクロサービスの監視とか」
  高橋: 「...正直、コンテナ環境の監視は厳しくなってきている。
         Nagiosのプラグインでは動的なサービスメッシュに対応できない」
  → 現行ツールの限界を本人から引き出す

Options:
  「もしNagiosの知見を活かしながら、新しいツールの設計を
   高橋さんがリードする形なら、どう感じますか?
   Nagiosのカスタムプラグインの知見は、Datadogのカスタム
   メトリクス設計に直接活かせます」
  → Nagiosの経験が「負債」ではなく「資産」になることを示す

Will:
  「まず、Nagiosのカスタムプラグイン50個の機能棚卸しを
   高橋さんに主導していただけませんか?
   どの機能をDatadogの標準機能で代替でき、
   どの機能をカスタム開発する必要があるか。
   高橋さんにしかできない仕事です」
  → 移行の「専門家」としての役割を提案

アクションプラン

アクション詳細
1. Nagios→Datadog機能マッピングのリード役に任命高橋さんの知識がなければ正確な移行はできないことを伝え、「あなたにしかできない」と位置づける
2. Datadogの高度な機能のハンズオン研修を先行提供高橋さんに最初にDatadogのスキルを身につけてもらい、チーム内での「Datadogエキスパート」ポジションを確立
3. Nagiosカスタムプラグインの「ベストプラクティス集」を高橋さんに執筆依頼15年の知見を文書化することで、ツールが変わっても知恵は残ることを体感してもらう

Mission 2: 開発チームマネージャーとの交渉

シナリオ

プロダクト開発チームのマネージャー中村さんとの会議で、以下のやり取りがありました。

中村: 「モニタリングツールの統一は賛成だ。ただし、うちのチームはQ3の大型リリースを控えていて、今が一番忙しい。ツール移行に工数を割く余裕はない。Q4以降なら検討できるが、Q3は絶対に無理だ。それに開発メンバー10名のうち、8名がCloudWatchしか使ったことがない。Datadogの学習コストも心配だ。」

さらに、後日のSlackで以下の情報が入りました。

「中村さんのチームのリリースは11月末で、実はQ4初頭(12月-1月)も不具合対応で忙しくなる見込みです。実質的に移行に取り組めるのは2月以降になりそうです」

要件

  1. 抵抗の分析: 中村さんの抵抗を類型分析する
  2. 交渉シナリオ: 原則立脚型交渉の4原則に基づいた対話を設計する
  3. Win-Win提案: 中村さんのチームにとってもメリットのある提案を3つ以上策定する
解答例

抵抗の分析

要素内容
類型Type D(慣性的反対)+ Type A(論理的反対)
表面の主張Q3は忙しい。学習コストが心配
本音リリースの成功が自分のチームの最優先事項。ツール移行で障害が起きるリスクを取りたくない
正当な懸念Q3の大型リリース期に移行作業を入れるのは確かにリスク。学習コストも実在する
恐れリリース失敗の責任を問われること

交渉シナリオ(原則立脚型)

原則1(人と問題を分離):
  「中村さんのQ3リリースの成功は当然最優先です。
   ツール移行がリリースの妨げになることは絶対に避けたい。
   その上で、一緒に最善のタイミングと方法を考えませんか」

原則2(利害に焦点):
  「Q3のリリースで一番心配していることは何ですか?
   例えばリリース後の障害対応が迅速にできるか、
   というような懸念はありますか?」
  中村: 「...実は前回のリリースで障害対応に12時間かかった。
         CloudWatchだけでは原因特定に時間がかかる」

原則3(双方の利益になる選択肢):
  「であれば、こういう提案はどうでしょう。
   Q3リリースの『モニタリング強化』としてDatadogを
   並行導入する。CloudWatchは維持したまま、
   Datadogを追加の可視化ツールとして使い始める。
   リリース後の障害対応が格段に速くなります。
   中村さんのチームにとっても、リリースの安全網が
   一つ増えることになります」

原則4(客観的基準):
  「SREチームAでは、Datadog導入後にMTTRが
   8時間から2時間に短縮されました。
   Q3リリースの安全性を高める投資として
   位置づけられませんか?」

Win-Win提案

提案中村さんチームのメリットモニタリング統一プロジェクトのメリット
Q3リリースの安全網としてDatadogを並行導入リリース後の障害対応時間が短縮移行の第一歩が始まる
SREチームがDatadogの初期設定を代行開発チームの工数負担を最小化標準設定が全チームに展開される
Datadogダッシュボードのテンプレートを提供学習コストを大幅に削減全チーム共通の可視化基盤ができる
Q3リリースのSRE支援(Datadogによるリアルタイム監視)を提供リリースの安全性が向上Datadogの価値を実感してもらえる

Mission 3: 支持者の連合を構築する

シナリオ

モニタリングツール統一プロジェクトの現状は以下の通りです。

  1. 賛成者は少数(SREチームとCTOのみ)
  2. 中立が大多数(開発チーム3つ、QAチーム)
  3. 反対が2名(運用チーム高橋、セキュリティ部長)
  4. セキュリティ部長は「外部SaaSへの監視データ送信はセキュリティポリシー違反の可能性がある」と主張
  5. 予算は承認済みだが、全社展開には各チームの「自発的な参加」が必要

要件

  1. 推進連合の設計: 誰をメンバーに含め、どんな役割を与えるか
  2. チェンジエージェントの配置: 各チームに1名、どういう基準で選ぶか
  3. セキュリティ部長への対応策: Win-Winの提案を設計する
  4. 展開戦略: 6チームをどの順番で巻き込むか、その理由
解答例

推進連合の設計

役割メンバー選出理由
エグゼクティブスポンサーCTO佐藤予算権限と経営層への影響力
変革リーダーあなた(推進リーダー)プロジェクト全体のオーナー
テクニカルチャンピオンSRE 鈴木Datadogの技術的知見、実装経験
運用代表高橋(移行後)Mission 1の対話で味方に変えた後、運用の専門知識を活用
開発代表チームDのテックリード技術好奇心が高く、チーム内で信頼されている
セキュリティ代表セキュリティ部 副部長部長よりも実務寄りで、技術的な対話が可能

チェンジエージェントの選出基準

基準理由
チーム内での信頼非公式な影響力を持っている
技術的好奇心新しいツールへの抵抗が少ない
コミュニケーション力チームメンバーの不安を聞き取り、サポートできる
中堅レベルベテランでも新人でもなく、両方の視点を理解できる

セキュリティ部長への対応

提案セキュリティ部のメリット
Datadog Privatelink(VPC内で完結する接続)の採用監視データがインターネットを経由しない
データ保持ポリシーの共同設計セキュリティ部がデータガバナンスを主導できる
セキュリティ監視ダッシュボードの構築をセキュリティ部が主導Datadogを「セキュリティ強化ツール」として位置づけ
導入前のセキュリティレビューをセキュリティ部が実施承認権限を持つことで統制を維持できる

展開戦略(順番と理由)

順番チーム理由
1stSREチーム既に賛成。テクニカルチャンピオンが所属。成功事例を作る
2ndチームDテックリードが前向き。早期のクイックウィンを作れる
3rd中村さんチームQ3リリースの安全網としてDatadogを並行導入(Mission 2の成果)
4thチームE中立。先行チームの成功事例で自然に興味を持つ
5thQAチームテスト環境のモニタリング改善として導入
6th運用チーム高橋さんを移行リーダーとして、最後に本番環境のNagiosを移行

達成度チェック

観点達成基準
抵抗の分析類型分析が正確で、表面の主張と本音が区別されている
対話シナリオGROWモデルや原則立脚型交渉が適切に使われている
Win-Win相手のメリットが具体的に示されている
推進連合多様な影響力を持つメンバーで構成されている
セキュリティ対応技術的な解決策とガバナンスの維持が両立している
展開戦略順番に明確な理由があり、段階的に拡大する設計になっている

推定所要時間: 90分