EXERCISE 45分

ストーリー

田中VPoE
DataFlow社のチャーン予測モデルをMLOps基盤に載せる設計をしてもらう
あなた
現在は手動(Level 0)なんですよね。Jupyter Notebookで月1回学習して、手動でデプロイしている
田中VPoE
そうだ。これをLevel 1(パイプライン自動化)に引き上げる。フィーチャーストアの導入、学習パイプラインの自動化、モデルモニタリングの設計を含む
あなた
データ基盤のGold層からフィーチャーを抽出して、フィーチャーストアに格納し、MLパイプラインで利用する流れですね
田中VPoE
その通り。データ基盤とMLOpsの接続点を明確に設計することが重要だ

ミッション概要

項目内容
演習タイトルMLOps基盤の設計
想定時間45分
成果物チャーン予測MLOps基盤設計書

Mission 1: フィーチャー設計

要件

DataFlow社のチャーン予測モデル用フィーチャーを設計してください。

  1. フィーチャーを10個以上定義する
  2. 各フィーチャーのデータソース(Gold層テーブル)を特定する
  3. オフライン/オンラインの提供方式を決定する
解答例

フィーチャー一覧

フィーチャー名定義データソースオフラインオンライン
avg_purchase_90d過去90日間の平均購入額fact_subscriptionBigQueryRedis
total_logins_30d過去30日間のログイン回数fact_user_activityBigQueryRedis
days_since_last_login最終ログインからの経過日数fact_user_activityBigQueryRedis
support_tickets_90d過去90日間のサポートチケット数外部連携テーブルBigQueryRedis
feature_usage_count_30d過去30日間の機能利用回数fact_user_activityBigQueryRedis
plan_type現在の契約プランdim_planBigQueryRedis
contract_months契約からの経過月数dim_customerBigQueryRedis
email_open_rate_30d過去30日間のメール開封率fact_campaign_performanceBigQueryRedis
mrr当月MRRfact_subscriptionBigQueryRedis
segment顧客セグメントdim_customerBigQueryRedis
session_duration_avg_30d過去30日間の平均セッション時間fact_user_activityBigQueryRedis
campaign_click_rate_30d過去30日間のキャンペーンクリック率fact_campaign_performanceBigQueryRedis

Mission 2: MLパイプラインの設計

要件

チャーン予測モデルの学習・デプロイパイプラインを設計してください。

  1. パイプラインの各ステップを定義する
  2. 使用するツールを選定する
  3. Continuous Trainingのトリガーを定義する
解答例

パイプライン構成

ステップ処理内容ツール
1. データ取得フィーチャーストアから学習データを取得Feast
2. データ検証フィーチャーの品質チェックGreat Expectations
3. 学習XGBoostモデルの学習XGBoost + MLflow
4. 評価AUC, Precision, Recall の計算MLflow
5. モデル登録モデルレジストリに登録MLflow Model Registry
6. 承認AUC >= 0.80 ならStaging → Production自動 + 手動承認
7. デプロイエンドポイントにデプロイVertex AI Endpoints
8. モニタリングデータドリフト、モデルドリフト監視Evidently

オーケストレーション

項目設定
オーケストレーターAirflow (Cloud Composer)
スケジュール毎週月曜日 3
AM
CTトリガーPSI > 0.25 or AUC < 0.80
通知Slack #ml-ops

Mission 3: モデルモニタリングの設計

要件

本番環境でのモデルモニタリング設計を行ってください。

  1. 監視すべきメトリクスを定義する
  2. ドリフト検知の閾値とアクション定義する
  3. A/Bテストの設計を行う
解答例

監視メトリクス

カテゴリメトリクス閾値アクション
モデル性能AUC< 0.80アラート + 再学習トリガー
モデル性能Precision< 0.75アラート
データドリフトPSI (各フィーチャー)> 0.25調査 + 再学習検討
予測分布予測スコア分布KS検定 p < 0.01アラート
レイテンシP99推論時間> 100msインフラ調査

A/Bテスト設計

項目設定
トラフィック分割新モデル20% / 既存モデル80%
評価期間2週間
主要メトリクスチャーン予測的中率、誤アラート率
統計的有意性p < 0.05 で判定

達成度チェック

観点達成基準
フィーチャー設計10個以上のフィーチャーが定義され、データソースが特定されている
パイプライン学習→評価→デプロイの各ステップとツール選定が設計されている
モニタリングドリフト検知の閾値とアクション、A/Bテスト設計が含まれている
データ基盤連携Gold層からフィーチャーストアへの接続が明確に設計されている

推定所要時間: 45分