QUIZ 15分

クイズの説明

Step 2「SLI/SLOを設計する」で学んだ内容の理解度を確認します。全8問、80%(7問)以上正解で合格です。


問題

Q1. SLIの設計原則として最も適切なものはどれですか?

  • A) CPU使用率やメモリ使用量などのインフラメトリクスを使う
  • B) ユーザー体験を反映する指標を、比率(0〜100%)で表現する
  • C) エラーの絶対数を追跡する
  • D) 開発チームのデプロイ頻度を測定する
答えを見る

正解: B

良いSLIはユーザー体験を反映し、比率(0〜100%のスケール)で表現できるものです。CPU使用率はインフラメトリクスでありユーザー体験と直接相関しません。エラーの絶対数はトラフィック量に依存するため比率で表現すべきです。デプロイ頻度はDORAメトリクスであり、SLIではありません。


Q2. 4つのゴールデンシグナルに含まれないものはどれですか?

  • A) レイテンシ(Latency)
  • B) トラフィック(Traffic)
  • C) 可用性(Availability)
  • D) 飽和度(Saturation)
答えを見る

正解: C

Googleが提唱する4つのゴールデンシグナルは「レイテンシ」「トラフィック」「エラー(Errors)」「飽和度」です。「可用性」はSLIのタイプとしては重要ですが、ゴールデンシグナルの4つには含まれません。エラー率が可用性に関連するメトリクスです。


Q3. SLI測定ポイントとして、ロードバランサーが多くのケースで推奨される理由はどれですか?

  • A) 最も安価に実装できるから
  • B) 全リクエストを網羅的に記録でき、ユーザー体験とのバランスが良いから
  • C) サーバー内部の詳細なメトリクスが取得できるから
  • D) クライアント側のネットワーク遅延も含めて測定できるから
答えを見る

正解: B

ロードバランサーは全リクエストを網羅的に記録でき、サーバー側のみの測定よりもユーザーに近い位置で測定できます。クライアント側ほどノイズが多くなく、データの信頼性も高いため、多くのケースで最適なバランスを提供します。


Q4. SLO目標値の設定で最も適切なアプローチはどれですか?

  • A) 業界最高水準の99.999%を最初から目標にする
  • B) 過去のパフォーマンスデータを分析し、達成可能な目標から段階的に引き上げる
  • C) 全サービスに同じSLO(例: 99.9%)を一律に適用する
  • D) 開発チームが希望する値をそのままSLOにする
答えを見る

正解: B

SLO設定はデータドリブンで行うべきです。過去6ヶ月以上のパフォーマンスデータを分析し、現実的に達成可能な目標を設定した上で、段階的に引き上げます。最初から高すぎる目標はエラーバジェットが即座に枯渇し、形骸化します。サービスの特性によって適切なSLOは異なるため、一律適用は不適切です。


Q5. Multi-Window Multi-Burn-Rateアラートで「短いウィンドウ」を併用する理由はどれですか?

  • A) 長いウィンドウより精度が高いから
  • B) 過去の障害の影響による長いウィンドウの誤検知を防ぐため
  • C) 短いウィンドウの方がバーンレートを正確に計算できるから
  • D) PagerDutyの仕様で短いウィンドウが必要だから
答えを見る

正解: B

長いウィンドウだけを使うと、過去に発生した障害の影響がウィンドウ内に残り、障害が解消した後もアラートが続く(誤検知)ことがあります。短いウィンドウを併用することで「現在もまだ問題が継続しているか」を確認し、過去のイベントによる誤報を防ぎます。


Q6. SLAとSLOの関係として正しいものはどれですか?

  • A) SLAとSLOは同じ値に設定すべき
  • B) SLAはSLOより高い(厳しい)目標にすべき
  • C) SLAはSLOより低い(緩い)目標にし、バッファを持たせるべき
  • D) SLAは不要で、SLOだけで十分
答えを見る

正解: C

SLAは顧客との契約であり違反すると金銭的ペナルティが発生するため、SLOよりも保守的(低い目標)に設定してバッファを持たせるべきです。例えば内部SLOが99.95%ならSLAは99.9%にすることで、SLOをわずかに下回っても即座にSLA違反にはなりません。


Q7. Prometheusのメトリクスタイプで、レイテンシのパーセンタイル計算に最適なものはどれですか?

  • A) Counter
  • B) Gauge
  • C) Histogram
  • D) Summary
答えを見る

正解: C

Histogramはリクエストをバケット(区間)ごとに分類して記録するため、サーバー側で集約しつつhistogram_quantile関数でp50/p90/p99等のパーセンタイルを計算できます。Summaryもパーセンタイルを提供しますが、クライアント側で計算するため複数インスタンス間での集約ができません。


Q8. ダッシュボード設計のREDメソッドの3要素はどれですか?

  • A) Reliability, Efficiency, Durability
  • B) Rate, Errors, Duration
  • C) Requests, Events, Data
  • D) Recovery, Escalation, Detection
答えを見る

正解: B

REDメソッドはサービス品質の可視化に使う3要素で、Rate(リクエストレート)、Errors(エラーレート)、Duration(レイテンシ)の頭文字です。リソースの可視化にはUSEメソッド(Utilization, Saturation, Errors)を使います。REDはサービス向け、USEはリソース向けと使い分けます。


結果

7問以上正解の場合

合格です。 SLI/SLO設計の知識をしっかり身につけました。SLIの設計からSLO目標の設定、アラート設計、ダッシュボード構築まで、SREの中核スキルが備わっています。

「SLI/SLOはSREの心臓部だ。次はオブザーバビリティ — 計測したデータをどう活用して問題を素早く発見し解決するか、その基盤を構築しよう」 — 佐藤CTO

6問以下の場合

もう少し復習しましょう。 Step 2のレッスンを再度読み返してください。

  • Q1-Q3を間違えた場合 → Step 2-1「SLIの設計」を復習
  • Q4-Q5を間違えた場合 → Step 2-2「SLOの設定」を復習
  • Q6を間違えた場合 → Step 2-3「SLAの管理」を復習
  • Q7-Q8を間違えた場合 → Step 2-4「計測とダッシュボード」を復習