QUIZ 30分

チェックポイント:SRE原則

ストーリー

「SRE原則の理解を確認しよう。 SLI/SLO、エラーバジェット、トイル削減。 この3つがSREの根幹だ」

松本先輩が最後のクイズを用意した。


クイズの説明

Step 5 で学んだSRE原則の知識を確認します。

  • 全6問
  • 合格ライン: 80%(5問正解)

問題

Q1. SLI、SLO、SLA の関係として正しいものはどれですか?

  • A) SLA > SLO > SLI の順で厳しく設定する
  • B) SLI で測定し、SLO で目標を設定し、SLA で顧客と契約する。SLO は SLA より厳しく設定する
  • C) SLI、SLO、SLA は全て同じ値を設定する
  • D) SLA を先に決めてから SLO と SLI を後付けで設定する
<details> <summary>解答と解説</summary>

正解: B

SLI(Service Level Indicator)は「何を測るか」、SLO(Service Level Objective)は「どこまでを目標とするか」、SLA(Service Level Agreement)は「顧客との契約」です。SLOはSLAより厳しく設定し、SLA違反前に対策を打てるようにします。

</details>

Q2. SLO が 99.9% のサービスにおけるエラーバジェット(30日間)として正しいものはどれですか?

  • A) 月間ダウンタイム約43分
  • B) 月間ダウンタイム約4分
  • C) 月間ダウンタイム約7時間
  • D) 月間ダウンタイム約5分
<details> <summary>解答と解説</summary>

正解: A

エラーバジェット = 1 - SLO = 1 - 0.999 = 0.001 = 0.1%。30日間の分数: 30 x 24 x 60 = 43,200分。許容ダウンタイム: 43,200 x 0.001 = 43.2分。約43分が月間の許容ダウンタイムです。

</details>

Q3. エラーバジェットが残り 20% になった場合、エラーバジェットポリシーに基づく最も適切な対応はどれですか?

  • A) 通常通りリリースを継続する
  • B) 機能リリースを凍結し、全リソースを信頼性改善に投入する
  • C) エラーバジェットのSLO目標値を緩和する
  • D) エラーバジェットの計測を停止する
<details> <summary>解答と解説</summary>

正解: B

エラーバジェット残量が25%未満(この場合20%)の場合、機能リリースを凍結し、全エンジニアリングリソースを信頼性改善に集中させます。これにより、SLO違反を防ぎ、エラーバジェットを回復させます。SLOの緩和(C)は最終手段であり、まずは改善に注力します。

</details>

Q4. トイルの特徴として正しくないものはどれですか?

  • A) 手動で行う作業
  • B) 反復的に発生する作業
  • C) アーキテクチャの設計作業
  • D) 自動化が可能な作業
<details> <summary>解答と解説</summary>

正解: C

アーキテクチャの設計はトイルではありません。トイルは「手動」「反復的」「自動化可能」「戦術的」「サービス成長に比例」の5つの特徴を持つ作業です。設計は創造的な知的作業であり、長期的な価値を生むエンジニアリング活動です。

</details>

Q5. Google SRE が推奨するトイル率の上限はどれですか?

  • A) 10%
  • B) 25%
  • C) 50%
  • D) 75%
<details> <summary>解答と解説</summary>

正解: C

Google SRE では、SREエンジニアの作業時間のうちトイルに費やす時間を50%未満に維持することを推奨しています。残りの50%以上をエンジニアリング(自動化ツール開発、モニタリング改善、信頼性向上)に使うことで、トイルを継続的に削減し、サービスの信頼性を向上させます。

</details>

Q6. バーンレートが 5.0x の場合の意味として正しいものはどれですか?

  • A) エラーバジェットが5倍に増えた
  • B) 通常の5倍の速度でエラーバジェットが消費されている
  • C) SLOの目標値が5倍厳しくなった
  • D) 5日以内にサービスが停止する
<details> <summary>解答と解説</summary>

正解: B

バーンレート5.0xは、通常の5倍の速度でエラーバジェットが消費されていることを意味します。通常のペース(1.0x)だと30日で使い切るエラーバジェットが、5.0xだと6日で枯渇する計算になります。これは緊急アラートの対象であり、即座に原因調査と対応が必要です。

</details>

結果

5問以上正解の場合

合格です。最終ステップに進みましょう。

「SREの基本原則はしっかり理解できている。 いよいよ最終ステップだ。全ての知識を統合して 品質の番人として認められよう」

4問以下の場合

もう少し復習しましょう。

問題復習セクション
Q1Step 5-2 SLI/SLOの設計
Q2Step 5-3 エラーバジェットの運用
Q3Step 5-3 エラーバジェットの運用
Q4Step 5-4 トイル削減の実践
Q5Step 5-4 トイル削減の実践
Q6Step 5-3 エラーバジェットの運用

次のステップへ

Step 6 は最終ステップです。総合演習と卒業クイズで、今月学んだ全ての知識を総動員しましょう。


推定読了時間: 30分