MLOpsツールランドスケープ

田中VPoE「MLOpsのコンポーネントがわかったところで、次はツール選定だ。世の中にはMLOpsツールが乱立している。闇雲に導入すると統合コストで地獄を見る。」

あなた「確かに、調べるだけでも数十種類ありますね。どう選べばいいんでしょうか？」

田中VPoE「まず全体を俯瞰して、選定の軸を持つことが大切だ。チーム規模・技術力・予算・既存インフラを考慮して、最小構成から始めよう。」

MLOpsツールの全体像

MLOpsツールは領域ごとに多数存在します。以下に主要カテゴリとツールを整理します。

カテゴリ別ツールマップ

カテゴリ	OSS	マネージドサービス
実験管理	MLflow, Weights & Biases, Neptune	SageMaker Experiments, Vertex AI
データバージョニング	DVC, LakeFS	Delta Lake (Databricks)
パイプライン	Airflow, Prefect, Dagster	SageMaker Pipelines, Vertex AI Pipelines
特徴量ストア	Feast, Hopsworks	SageMaker Feature Store, Vertex AI Feature Store
モデルサービング	Seldon Core, BentoML, TorchServe	SageMaker Endpoints, Vertex AI Prediction
モニタリング	Evidently AI, Whylogs, NannyML	SageMaker Model Monitor, Fiddler
データ品質	Great Expectations, Pandera	Soda, Monte Carlo
ML Platform	Kubeflow, MLRun	Databricks, SageMaker, Vertex AI

ツール選定の判断軸

5つの選定基準

基準	質問	考慮事項
チーム規模	何人のDSが使う？	小チームはシンプル構成、大チームはプラットフォーム
技術力	Kubernetes運用できる？	運用力がないならマネージド優先
予算	月額いくら使える？	OSSは無料だが運用コストがかかる
既存インフラ	AWS？GCP？オンプレ？	クラウドベンダーのツールは統合が楽
モデル数	何モデル運用する？	少数ならシンプル、多数ならプラットフォーム

チーム規模別の推奨構成

小規模チーム（DS 1-3名）

推奨構成: ミニマルMLOps
────────────────────
実験管理:     MLflow（ローカル）
バージョン管理: Git + DVC
パイプライン:  シェルスクリプト or Makefile
サービング:    FastAPI + Docker
モニタリング:  Evidently AI（レポート生成）

メリット: 導入コストが低い、学習コストが低い
デメリット: スケールしにくい

中規模チーム（DS 4-10名）

推奨構成: スタンダードMLOps
────────────────────────
実験管理:     MLflow（サーバーモード）
バージョン管理: Git + DVC + S3
特徴量ストア:  Feast
パイプライン:  Prefect or Airflow
サービング:    BentoML or Seldon Core
モニタリング:  Evidently AI + Grafana
CI/CD:        GitHub Actions

メリット: バランスが良い、拡張性あり
デメリット: 運用工数がそれなりにかかる

大規模チーム（DS 10名以上）

推奨構成: エンタープライズMLOps
──────────────────────────
ML Platform:  Kubeflow or Databricks
実験管理:     Weights & Biases or MLflow
特徴量ストア:  Feast + Redis（オンライン）
パイプライン:  Kubeflow Pipelines or Airflow
サービング:    Seldon Core + Istio
モニタリング:  Evidently + Prometheus + Grafana
ガバナンス:    MLflow Model Registry + 承認フロー

メリット: スケーラブル、ガバナンスが充実
デメリット: 導入・運用コストが高い

主要ツールの詳細比較

実験管理ツール

項目	MLflow	Weights & Biases	Neptune
ライセンス	OSS (Apache 2.0)	フリーミアム	フリーミアム
セットアップ	簡単	非常に簡単	簡単
UI	基本的	リッチ	リッチ
チームコラボ	自前サーバー必要	クラウド標準	クラウド標準
モデルレジストリ	あり	あり	なし
コスト（10名）	無料（インフラ費のみ）	$100-300/月	$100-300/月

パイプラインツール

項目	Airflow	Prefect	Dagster	Kubeflow
学習コスト	中	低	中	高
スケーラビリティ	高	中-高	中-高	非常に高
ML特化度	低（汎用）	低-中	中	高
Kubernetes必要	オプション	オプション	オプション	必須
コミュニティ	非常に大きい	成長中	成長中	大きい

特徴量ストア

項目	Feast	Hopsworks	Tecton
ライセンス	OSS	OSS/有料	SaaS
オンラインストア	Redis, DynamoDB等	内蔵	内蔵
オフラインストア	BigQuery, Redshift等	内蔵	内蔵
リアルタイム変換	限定的	あり	あり
セットアップ難易度	中	高	低

クラウドベンダー別MLOpsスタック

AWS

データ管理:    S3 + Glue Data Catalog
実験管理:     SageMaker Experiments
パイプライン:  SageMaker Pipelines + Step Functions
特徴量ストア:  SageMaker Feature Store
サービング:    SageMaker Endpoints
モニタリング:  SageMaker Model Monitor + CloudWatch

GCP

データ管理:    GCS + BigQuery + Dataplex
実験管理:     Vertex AI Experiments
パイプライン:  Vertex AI Pipelines（Kubeflow ベース）
特徴量ストア:  Vertex AI Feature Store
サービング:    Vertex AI Prediction
モニタリング:  Vertex AI Model Monitoring

Azure

データ管理:    Azure Blob + Azure Data Lake
実験管理:     Azure ML Experiments
パイプライン:  Azure ML Pipelines
特徴量ストア:  Feathr（OSS）
サービング:    Azure ML Endpoints
モニタリング:  Azure ML Data Drift Monitor

今回のコースで採用する構成

田中VPoE「うちのDSチームは5人。AWS上で動いている。まずは中規模チーム向けの構成で始めよう。」

あなた「OSSベースで、段階的に拡張していく方針ですね。」

田中VPoE「そうだ。まずは使いこなせるようになることが先決だ。」

コンポーネント	採用ツール	選定理由
実験管理	MLflow	OSS、モデルレジストリ内蔵、学習コスト低
データバージョニング	DVC	Git連携、S3バックエンド
特徴量ストア	Feast	OSS、AWS統合可
パイプライン	GitHub Actions	既存CI/CDの拡張
サービング	FastAPI + Docker	シンプル、カスタマイズ性高
モニタリング	Evidently AI	OSS、レポート生成が簡単
データ品質	Great Expectations	Python ネイティブ、豊富なバリデーション

まとめ

項目	ポイント
ツール乱立	領域ごとに多数のツールが存在
選定基準	チーム規模・技術力・予算・既存インフラ・モデル数
構成パターン	小規模→ミニマル、中規模→スタンダード、大規模→エンタープライズ
クラウド統合	各ベンダーが包括的なMLOpsスタックを提供
本コースの構成	MLflow + DVC + Feast + GitHub Actions + Evidently AI

チェックリスト

MLOpsの主要カテゴリのツールを3つ以上挙げられる
ツール選定の5つの基準を説明できる
チーム規模に応じた推奨構成を提案できる
本コースで使用するツール構成とその選定理由を説明できる

次のステップへ

ツールランドスケープを把握しました。次は演習で、自チームのMLOps成熟度を評価し、導入ロードマップを作成しましょう。

推定読了時間：30分