MLパイプライン自動化クイズ
Step 4で学んだ学習パイプライン設計、CI/CD for ML、デプロイメントパイプライン、ML CI/CD実装について理解度を確認しましょう。10問中8問以上の正解で合格です。
Q1. DAGの特徴
MLパイプラインで使用されるDAG(有向非巡回グラフ)の特徴として正しいものはどれですか?
- A: タスクは循環的に繰り返し実行される
- B: タスク間の依存関係を明確にし、変更部分だけ再実行できる
- C: 全タスクは必ず並列実行される
- D: DAGではタスクの順序を指定できない
正解と解説
正解: B
DAG(有向非巡回グラフ)はタスク間の依存関係を方向付きで定義し、循環を持ちません。これにより、変更があった部分から下流のタスクだけを再実行できます。
Q2. ML CI/CDのトリガー
ML CI/CDで考慮すべき3つのトリガーに含まれないものはどれですか?
- A: コード変更
- B: データ変更
- C: インフラ変更
- D: モデル変更
正解と解説
正解: C
ML CI/CDの主要なトリガーは「コード変更」「データ変更」「モデル変更」の3つです。インフラ変更はDevOps/IaCの領域であり、ML CI/CD固有のトリガーではありません。
Q3. 品質ゲート
モデルの品質ゲートの目的として最も適切なものはどれですか?
- A: モデルの学習速度を向上させる
- B: 基準を満たさないモデルのデプロイを自動でブロックする
- C: データの前処理を自動化する
- D: 特徴量の数を最適化する
正解と解説
正解: B
品質ゲートは、AUC-ROC・F1スコア・推論レイテンシなどの指標に閾値を設け、基準を満たさないモデルが本番にデプロイされることを防ぐ仕組みです。
Q4. カナリアリリース
カナリアリリースの説明として正しいものはどれですか?
- A: 本番トラフィックの一部を新モデルに流し、段階的に比率を上げる
- B: 新旧2つの環境を用意し、一度に切り替える
- C: 新モデルにトラフィックを流すが、応答はしない
- D: テスト環境でのみ新モデルを実行する
正解と解説
正解: A
カナリアリリースは、本番トラフィックの一部(例: 5%)を新モデルに流し、問題がなければ段階的に比率を増やしていくデプロイ戦略です。Bはblue-green、Cはシャドウデプロイの説明です。
Q5. モデルサービングパターン
大量の顧客データに対して夜間バッチで推論を行うケースに最も適したサービングパターンはどれですか?
- A: REST APIサービング
- B: バッチ推論
- C: エッジデプロイ
- D: ストリーミング推論
正解と解説
正解: B
大量データに対する夜間処理にはバッチ推論が適しています。REST APIはリアルタイムの個別推論、エッジデプロイはデバイス上での推論に適しています。
Q6. データバリデーション
学習パイプラインにデータバリデーションを組み込む目的として最も適切なものはどれですか?
- A: 学習速度を向上させる
- B: 不正なデータでモデルが学習されることを防ぐ
- C: 特徴量を自動的に選択する
- D: モデルのハイパーパラメータを最適化する
正解と解説
正解: B
データバリデーションは、スキーマ違反・欠損値・異常値などの不正データでモデルが学習されることを防ぎます。Great Expectationsなどのツールで自動化できます。
Q7. ロールバック戦略
モデルデプロイ後のロールバック条件として適切でないものはどれですか?
- A: p99レイテンシが閾値を超えた
- B: AUC-ROCが基準値を下回った
- C: エラー率が閾値を超えた
- D: モデルのファイルサイズが大きい
正解と解説
正解: D
モデルのファイルサイズはデプロイ前に確認すべき項目であり、デプロイ後のロールバック条件としては適切ではありません。レイテンシ、精度、エラー率の変化がロールバックの主な判断基準です。
Q8. Blue-Greenデプロイ
Blue-Greenデプロイの最大の利点はどれですか?
- A: リソースが少なくて済む
- B: 段階的にトラフィックを移行できる
- C: 問題発生時に即座にロールバックできる
- D: 新旧モデルの精度比較が自動でできる
正解と解説
正解: C
Blue-Greenデプロイでは新旧2つの環境を並行稼働させるため、問題発生時にロードバランサーの切り替えだけで即座にロールバックできます。欠点はリソースが2倍必要なことです。
Q9. 設定ファイル駆動
学習パイプラインでハイパーパラメータをYAML設定ファイルで管理する利点として正しくないものはどれですか?
- A: コード変更なしでパラメータを調整できる
- B: 設定のバージョン管理が容易になる
- C: モデルの精度が自動的に向上する
- D: 実験の再現性が向上する
正解と解説
正解: C
設定ファイルでの管理は、パラメータ変更の容易さ、バージョン管理、再現性向上に寄与しますが、精度の自動向上には直結しません。精度向上にはハイパーパラメータチューニングが別途必要です。
Q10. シャドウデプロイ
シャドウデプロイの特徴として正しいものはどれですか?
- A: ユーザーへの影響なく新モデルの本番データでの挙動を検証できる
- B: ユーザーの一部に新モデルの応答を返す
- C: 新旧モデルを交互に切り替える
- D: テスト環境でのみ新モデルを検証する
正解と解説
正解: A
シャドウデプロイでは、本番トラフィックを新モデルにも流しますが、ユーザーへの応答は現行モデルのみが行います。新モデルの結果はログに記録されるだけなので、ユーザーへの影響はゼロです。
結果
| 正答数 | 判定 |
|---|---|
| 8-10問 | 合格 - Step 5に進みましょう |
| 6-7問 | もう一度レッスンを復習しましょう |
| 5問以下 | Step 4のレッスンを最初から再学習しましょう |
推定所要時間:30分