クイズの説明
Step 2「統合可観測性プラットフォームを設計しよう」の理解度を確認します。プラットフォームアーキテクチャ、データ収集、ストレージ、可視化について問います。
合格ライン: 80%(5問中4問正解)
問題
Q1. OpenTelemetryの選定理由
組織の可観測性計装標準としてOpenTelemetryを採用する最大のメリットはどれですか?
- A. 他のどの計装ライブラリよりも高速に動作する
- B. ベンダーに依存せず、バックエンドを自由に選択・変更できる
- C. 設定なしで全てのアプリケーションを自動的に計装できる
- D. 無料で利用できるため、ライセンスコストがゼロになる
答えを見る
正解: B
OpenTelemetryの最大のメリットはベンダー非依存性(Vendor Neutrality)です。CNCF Graduated Projectとして標準化されており、計装コードを変更せずにバックエンド(Datadog、Grafana Cloud、New Relic等)を自由に切り替えることができます。パフォーマンス(A)は他の計装ライブラリと大差なく、設定不要の完全自動計装(C)は正確ではありません(自動計装は対応していますが設定は必要です)。OSSであるため無料ですが(D)、ライセンスコストゼロは主要なメリットではなく、真の価値はロックイン回避にあります。
Q2. テイルサンプリング
テイルサンプリングについて、正しい説明はどれですか?
- A. リクエストの最初のスパンで確率的にサンプリングを決定する手法
- B. リクエストの全スパンが完了した後、結果に基づいてサンプリングを決定する手法
- C. ログの末尾(tail)だけを収集する手法
- D. 古いデータから順に削除していくストレージ管理手法
答えを見る
正解: B
テイルサンプリングは、リクエスト(トレース)の全スパンが完了した「後」に、その結果(エラーの有無、レイテンシなど)に基づいてサンプリングを決定する手法です。これにより「エラートレースは100%保持、正常トレースは10%のみ保持」のようなポリシーが実現できます。リクエスト開始時に決定する(A)のはヘッドサンプリングです。ログの末尾(C)やストレージ管理(D)とは無関係です。
Q3. データティアリング
可観測性データのティアリング戦略において、「Hot」ティアに最も適したデータはどれですか?
- A. 3年前のコンプライアンス監査ログ
- B. 直近7日間のフル解像度メトリクスとアクティブトレース
- C. 30日以上前のダウンサンプリングされたメトリクス
- D. 年次レポート用の集計データ
答えを見る
正解: B
Hotティアは最もアクセス頻度が高く、レイテンシ要件が厳しいデータを格納します。インシデント対応やリアルタイム分析に必要な直近7日間のフル解像度メトリクスとアクティブトレース(B)が最適です。コンプライアンス監査ログ(A)はArchiveティア、ダウンサンプリングされた古いメトリクス(C)はColdティア、年次レポート用データ(D)はCold/Archiveティアが適切です。HotティアのストレージコストはSSD/メモリベースで高いため、本当に即座にアクセスが必要なデータのみを配置すべきです。
Q4. ダッシュボード設計
ダッシュボードの4層設計において、「Layer 2: サービスダッシュボード」で最も重要な設計原則はどれですか?
- A. できるだけ多くのメトリクスを1画面に詰め込み、情報密度を最大化する
- B. REDメソッド(Rate/Errors/Duration)に基づきSLI/SLOとエラーバジェットを中心に構成する
- C. インフラリソース(CPU/メモリ/ディスク)の使用率をメインに表示する
- D. ログの全文検索機能を中心に構成する
答えを見る
正解: B
Layer 2(サービスダッシュボード)はチームリード・マネージャーが対象であり、サービスの「健全性」をSLI/SLOの観点で一目で把握できることが最も重要です。REDメソッド(Rate/Errors/Duration)に基づき、SLO達成状態、エラーバジェット残量、リクエストレート、エラーレート、レイテンシを中心に構成します。多くのメトリクスを詰め込む(A)のは「情報過多」というアンチパターンです。インフラリソース(C)はLayer 3(オペレーションダッシュボード)、ログ検索(D)はLayer 4(探索ダッシュボード)の領域です。
Q5. プラットフォーム移行
可観測性プラットフォームの移行において、最もリスクが低いアプローチはどれですか?
- A. ビッグバン方式で全チームを同時に新プラットフォームに移行する
- B. パイロットチームで検証後、段階的に他のチームに展開し、移行期間中は新旧両システムに並行してデータを送信する
- C. 最も成熟度が低いチームから優先的に移行し、移行と同時に旧システムを即座に停止する
- D. 外部コンサルタントに全ての移行作業を一括委託する
答えを見る
正解: B
プラットフォーム移行の最もリスクが低いアプローチは「パイロット→段階展開→並行運用」です。パイロットチームで新プラットフォームの機能・性能・運用性を検証し、課題を洗い出してから他チームに展開します。移行期間中は新旧両システムにデータを並行送信することで、万が一新システムに問題があっても旧システムでデータを確認でき、データ欠損のリスクを最小化できます。ビッグバン方式(A)は問題発生時の影響が大きすぎ、旧システム即停止(C)はデータ欠損リスクが高く、一括委託(D)は組織内のナレッジ蓄積につながりません。
結果
合格(4問以上正解)
Step 2の内容をよく理解しています。統合可観測性プラットフォームの設計に必要なアーキテクチャ、データ収集、ストレージ、可視化の知識を身につけました。次のStep 3「SLI/SLO体系を組織に展開しよう」に進みましょう。
不合格(3問以下正解)
Step 2の内容を復習しましょう。特に以下のポイントを重点的に確認してください:
- OpenTelemetry — ベンダー非依存性とCollectorのデプロイメントパターン
- サンプリング — ヘッド/テイルサンプリングの違いと推奨ポリシー
- ストレージ — データティアリングと各ティアの適用基準
- ダッシュボード — 4層設計とRED/USEメソッドの適用
推定所要時間: 30分