MLOps全体像クイズ
Step 1で学んだMLOpsの基本概念、成熟度モデル、構成要素、ツールランドスケープについて理解度を確認しましょう。10問中8問以上の正解で合格です。
Q1. MLOpsの定義
MLOpsの説明として最も適切なものはどれですか?
- A: 機械学習モデルの精度を向上させるための手法
- B: 機械学習モデルの開発から本番運用までを効率的かつ信頼性高く行うためのプラクティス・ツール・文化の総称
- C: データサイエンティストがコーディングスキルを向上させるためのフレームワーク
- D: クラウド上で機械学習モデルを実行するためのサービス
正解と解説
正解: B
MLOpsはML + Dev + Opsのプラクティス・ツール・文化の総称です。モデル精度向上だけでなく、再現性・自動化・継続的改善・スケーラビリティ・ガバナンスを包括的に扱います。
Q2. DevOpsとMLOpsの違い
DevOpsにはなくMLOpsで追加される要素として正しくないものはどれですか?
- A: データバージョニング
- B: モデルバリデーション
- C: ソースコード管理
- D: データドリフト検出
正解と解説
正解: C
ソースコード管理はDevOpsにも存在する基本要素です。MLOpsではこれに加えて、データバージョニング、モデルバリデーション、データドリフト検出などML固有の要素が追加されます。
Q3. 成熟度モデル Level 0
MLOps成熟度 Level 0(手動プロセス)の特徴として正しいものはどれですか?
- A: MLflowで実験を一元管理している
- B: CI/CDパイプラインで自動デプロイしている
- C: Notebookで個人管理し、モデルを手動でデプロイしている
- D: データドリフトを自動検知して再学習している
正解と解説
正解: C
Level 0は手動プロセスの段階です。実験はNotebookで個人管理、モデルは手動デプロイ、テストやモニタリングは存在しない状態です。
Q4. 成熟度モデルの移行
Level 0からLevel 1への移行で最初に行うべきタスクとして最も適切なものはどれですか?
- A: カナリアデプロイの導入
- B: 実験トラッキングの導入とパイプラインのコード化
- C: 自動再学習パイプラインの構築
- D: A/Bテスト基盤の構築
正解と解説
正解: B
Level 0→1の移行では、まず実験トラッキング(MLflow等)の導入とNotebookからスクリプトへの移行(パイプラインのコード化)が最優先です。カナリアデプロイや自動再学習はLevel 3の要素です。
Q5. Training-Serving Skew
Training-Serving Skewの説明として正しいものはどれですか?
- A: 学習データが不足してモデルの精度が低い状態
- B: 学習時と推論時で異なる特徴量計算が行われ、結果が乖離する問題
- C: モデルの学習に時間がかかりすぎてデプロイが遅れる問題
- D: 複数のモデルバージョンが混在して管理できない問題
正解と解説
正解: B
Training-Serving Skewは、学習時と推論時で特徴量の計算方法やデータの前処理が異なることで、本番環境での予測精度が学習時と乖離する問題です。特徴量ストアはこの問題を解決するコンポーネントです。
Q6. MLOpsの構成要素
MLOpsの主要コンポーネントに含まれないものはどれですか?
- A: 実験管理
- B: 特徴量ストア
- C: ビジネスロジック開発
- D: モデルレジストリ
正解と解説
正解: C
MLOpsの主要コンポーネントは、データ管理、実験管理、モデルレジストリ、特徴量ストア、パイプラインオーケストレーション、サービング、モニタリングです。ビジネスロジック開発はMLOps固有のコンポーネントではありません。
Q7. ツール選定
小規模DSチーム(1-3名)に最も適したMLOps構成はどれですか?
- A: Kubeflow + Feast + Seldon Core + Prometheus
- B: MLflow(ローカル)+ DVC + FastAPI + Evidently AI
- C: SageMaker全スタック
- D: Databricks + Tecton + MLflow
正解と解説
正解: B
小規模チームでは導入コスト・学習コストの低いミニマル構成が適しています。MLflowローカル、DVC、FastAPI、Evidently AIの組み合わせはOSSベースでシンプルに始められます。Kubeflowや大規模プラットフォームは運用負荷が高すぎます。
Q8. モニタリング対象
本番MLシステムのモニタリングで、従来のソフトウェアにはないML固有の監視対象はどれですか?
- A: CPU使用率
- B: レスポンスタイム
- C: データドリフトとモデル精度の変化
- D: エラー率
正解と解説
正解: C
CPU使用率、レスポンスタイム、エラー率は従来のソフトウェアでも監視する項目です。データドリフト(入力データの分布変化)とモデル精度の変化はML固有の監視対象です。
Q9. モデルレジストリ
モデルレジストリの主要な機能として正しくないものはどれですか?
- A: モデルのバージョン管理
- B: ステージ管理(Staging → Production → Archived)
- C: ハイパーパラメータの自動最適化
- D: 本番昇格時の承認フロー
正解と解説
正解: C
モデルレジストリの機能は、バージョニング、ステージ管理、メタデータ管理、承認フロー、ロールバックです。ハイパーパラメータの自動最適化は実験管理やAutoMLの領域であり、モデルレジストリの機能ではありません。
Q10. MLOpsの期待効果
MLOps導入後に期待できる改善として正しくないものはどれですか?
- A: モデルデプロイ所要時間が1週間から数時間に短縮
- B: 実験の再現率が100%に向上
- C: モデルの精度が必ず向上する
- D: 性能劣化をリアルタイムで検知できる
正解と解説
正解: C
MLOpsはモデルの運用効率・再現性・信頼性を向上させますが、モデルの精度そのものを必ず向上させるものではありません。精度向上はデータサイエンスの領域です。MLOpsは精度劣化を素早く検知し、対応できる仕組みを提供します。
結果
| 正答数 | 判定 |
|---|---|
| 8-10問 | 合格 - Step 2に進みましょう |
| 6-7問 | もう一度レッスンを復習しましょう |
| 5問以下 | Step 1のレッスンを最初から再学習しましょう |
推定所要時間:15分