クイズの説明
Step 1「SRE組織のミッションを定義しよう」の理解度を確認します。SREの基本原則、従来運用との違い、組織モデルについて問います。
合格ライン: 80%(5問中4問正解)
問題
Q1. SREとDevOpsの関係
SREとDevOpsの関係について、最も適切な説明はどれですか?
- A. SREはDevOpsの一部であり、DevOpsの中の運用担当を指す
- B. DevOpsは文化・哲学であり、SREはその具体的なプラクティス・実装である
- C. SREはDevOpsの後継であり、DevOpsを置き換えるものである
- D. DevOpsとSREは独立した概念であり、関連性はない
答えを見る
正解: B
DevOpsは「開発と運用の壁を壊す」という文化・哲学・ムーブメントです。SREは「信頼性をエンジニアリングする」という具体的なプラクティス・フレームワークです。「DevOpsがアジャイルの思想なら、SREはスクラムのフレームワーク」と例えることができます。SREはSLI/SLO、エラーバジェット、トイル削減、ポストモーテムなど、DevOpsの考え方を具体的に実装した手法群です。
Q2. トイルの50%ルール
SREの原則における「トイルの50%ルール」について正しい記述はどれですか?
- A. SREチームの時間の50%以上をトイル(手動運用作業)に費やすべきである
- B. SREチームの時間の50%以下をトイルに、50%以上をエンジニアリングに費やすべきである
- C. 組織全体の運用作業を50%削減することを目標とする
- D. トイルが50%を超えたら、そのサービスのSRE支援を打ち切るべきである
答えを見る
正解: B
SREの原則では、SREチームの時間配分として「トイル(手動の繰り返し運用作業)は50%以下」「エンジニアリング(自動化・改善活動)は50%以上」を維持することが求められます。トイルが50%を超えた場合は、SRE支援を打ち切るのではなく、組織として対策(自動化の推進、トイルの根本原因の解消)が必要です。
Q3. SREと従来運用の根本的な違い
SREと従来運用の最も根本的な発想の違いはどれですか?
- A. 使用するツールの違い(クラウドネイティブ vs オンプレミス)
- B. チーム規模の違い(大規模 vs 小規模)
- C. 「障害を防ぐ」から「障害からの回復を速くする」への発想転換
- D. 運用作業を開発者に押し付けること
答えを見る
正解: C
SREの最も根本的な発想転換は、「障害をゼロにする」という不可能な目標から、「障害は必ず起きる。重要なのは素早く回復できること」という現実的なアプローチへの転換です。これにより、ランブック、SLOベースの判断、ブレームレスポストモーテム、自動ロールバックなどの具体的なプラクティスが導かれます。ツールの違い(A)やチーム規模(B)は本質ではなく、開発者に運用を押し付ける(D)のは共有オーナーシップの誤解です。
Q4. SRE組織モデルの選定
以下の状況に最も適したSRE組織モデルはどれですか?
社内にSRE経験者がおらず、予算制約から新規採用は2名まで。20チーム以上あり、SRE文化は存在しない。
- A. 組み込み型SRE(各チームにSREを配置)
- B. 中央集権型SRE + コンサルティング要素
- C. 完全なハイブリッド型SRE
- D. 各チームが独自にSREプラクティスを導入
答えを見る
正解: B
SRE人材が少ない(2名)、チーム数が多い(20+)、SRE文化が未形成という条件では:
- 組み込み型(A)は20チーム分のSREが必要で非現実的
- 完全なハイブリッド型(C)も人材不足で実現困難
- 各チーム独自導入(D)はバラバラになりカオスを招く
- 中央集権型で少数精鋭のSREチームを立ち上げ、コンサルティング要素で各チームにSRE文化を浸透させるアプローチが最適です
Q5. エラーバジェットの本質
SREにおけるエラーバジェットの本質的な役割はどれですか?
- A. 障害を起こした開発者へのペナルティの基準
- B. 開発チームと運用チームの対立を定量的に解消する合意形成の仕組み
- C. SLAに違反した場合の顧客への返金額の計算基準
- D. SREチームの人事評価のKPI
答えを見る
正解: B
エラーバジェットの本質は、「開発速度(リリース頻度)」と「信頼性」のトレードオフを定量的に管理する仕組みです。エラーバジェットが十分あれば新機能リリースを加速し、不足すれば信頼性改善に集中する — この客観的な基準があることで、「早く出したい」開発チームと「安定を守りたい」運用チームの対立が、感情的な議論からデータに基づく合意形成に変わります。ペナルティの基準(A)やSLAの返金計算(C)は誤った理解です。
結果
合格(4問以上正解)
Step 1の内容をよく理解しています。SREの基本原則、従来運用との違い、組織モデルの選定方法を身につけました。次のStep 2「エラーバジェットポリシーを策定しよう」に進みましょう。SLI/SLOの設計とエラーバジェットポリシーの策定を学びます。
不合格(3問以下正解)
Step 1の内容を復習しましょう。特に以下のポイントを重点的に確認してください:
- SREの7つの原則 — 信頼性はビジネス指標、SLO意思決定、トイル削減が核心
- 従来運用との発想転換 — 「防ぐ」から「回復を速くする」
- 組織モデルの選定 — 制約条件に基づく現実的な判断
推定所要時間: 15分