カリキュラム
L3
Month 4
Month 4
SRE, SLI/SLO設計, 可観測性, インシデント管理
SREプラクティスを導入しよう
全32ステップ · 約20時間
Step 1: Step 1
0時間
1-1
SREとは何か
LESSON
30分
1-2
信頼性エンジニアリングの基礎
LESSON
30分
1-3
エラーバジェットの考え方
LESSON
30分
1-4
トイルの削減
LESSON
30分
1-5
演習:SRE原則を適用しよう
EXERCISE
60分
1-6
理解度チェック
QUIZ
15分
Step 2: Step 2
0時間
2-1
SLIの設計
LESSON
40分
2-2
SLOの設定
LESSON
40分
2-3
SLAの管理
LESSON
40分
2-4
計測とダッシュボード
LESSON
40分
2-5
演習:SLI/SLOを設計しよう
EXERCISE
60分
2-6
理解度チェック
QUIZ
15分
Step 3: Step 3
0時間
3-1
オブザーバビリティの3本柱
LESSON
40分
3-2
Prometheus/Grafana
LESSON
40分
3-3
分散トレーシング
LESSON
40分
3-4
構造化ログとログ集約
LESSON
40分
3-5
演習:オブザーバビリティ基盤を構築しよう
EXERCISE
60分
3-6
理解度チェック:可観測性
QUIZ
15分
Step 4: Step 4
0時間
4-1
効果的なアラート設計
LESSON
40分
4-2
オンコール体制の構築
LESSON
40分
4-3
ランブックの作成
LESSON
40分
4-4
カオスエンジニアリング入門
LESSON
40分
4-5
演習:アラートとオンコールを設計しよう
EXERCISE
60分
4-6
チェックポイント
QUIZ
35分
Step 5: Step 5
0時間
5-1
インシデント管理プロセス
LESSON
30分
5-2
インシデント対応の実践
LESSON
30分
5-3
根本原因分析の手法
LESSON
25分
5-4
再発防止策の策定
LESSON
20分
5-5
演習:インシデント対応を実践しよう
EXERCISE
50分
5-6
チェックポイント
QUIZ
15分
Step 6: Step 6
0時間
6-1
総合演習:ポストモーテム
EXERCISE
90分
6-2
卒業クイズ
QUIZ
30分