カリキュラム
L2
Month 7
Month 7
オブザーバビリティ, ログ/メトリクス/トレース, 信頼性設計
システムの脈拍を見守ろう
全32ステップ · 約20時間
Step 1: Step 1
0時間
1-1
なぜオブザーバビリティが必要か
LESSON
15分
1-2
モニタリング vs オブザーバビリティ
LESSON
25分
1-3
Three Pillars: ログ・メトリクス・トレース
LESSON
25分
1-4
OpenTelemetryの全体像
LESSON
25分
1-5
SLI/SLO/SLAの定義
LESSON
15分
1-6
理解度チェック
QUIZ
15分
Step 2: Step 2
0時間
2-1
構造化ログの基本
LESSON
30分
2-2
ログレベルとフィルタリング
LESSON
30分
2-3
集約と検索
LESSON
30分
2-4
ログによるデバッグとトラブルシューティング
LESSON
30分
2-5
演習:ログ基盤を設計しよう
EXERCISE
90分
2-6
チェックポイント
QUIZ
30分
Step 3: Step 3
0時間
3-1
メトリクスの種類と収集
LESSON
25分
3-2
Prometheusによるメトリクス収集
LESSON
30分
3-3
Grafanaによる可視化
LESSON
30分
3-4
アラート設計のベストプラクティス
LESSON
25分
3-5
演習:ダッシュボードを設計しよう
EXERCISE
60分
3-6
チェックポイント
QUIZ
30分
Step 4: Step 4
0時間
4-1
分散トレーシングの基本
LESSON
40分
4-2
Jaeger/Zipkinの活用
LESSON
40分
4-3
サービス依存関係の可視化
LESSON
40分
4-4
パフォーマンスボトルネックの特定
LESSON
40分
4-5
演習:トレーシングを導入しよう
EXERCISE
90分
4-6
チェックポイント
QUIZ
30分
Step 5: Step 5
0時間
5-1
SREの原則
LESSON
30分
5-2
障害対応とインシデント管理
LESSON
30分
5-3
カオスエンジニアリング
LESSON
30分
5-4
ポストモーテムと継続的改善
LESSON
30分
5-5
演習:SRE運用計画を作ろう
EXERCISE
90分
5-6
チェックポイント
QUIZ
30分
Step 6: Step 6
0時間
6-1
総合演習:本番障害の原因を特定せよ
EXERCISE
90分
6-2
卒業クイズ
QUIZ
30分