Data Meshの4つの原則
田中VPoE「データ基盤が成長すると、中央集権型のデータチームがボトルネックになる。全てのデータリクエストが1つのチームに集中するからだ。」
あなた「確かに、データチームは常にバックログが溜まっている状態です。」
田中VPoE「Data Meshはこの問題を根本から解決するアーキテクチャだ。データの所有権をドメインに分散させるという発想転換を学ぼう。」
Data Meshとは
Data Meshは、Zhamak Dehghaniが提唱した分散型データアーキテクチャのパラダイムです。従来の中央集権型データプラットフォームの限界を克服するために、4つの原則に基づいてデータ管理を再設計します。
従来型アーキテクチャの課題
中央集権型データプラットフォーム
[営業] ─┐
[マーケ] ─┤→ [中央データチーム] → [データウェアハウス] → [消費者]
[サポート]─┤
[商品] ──┘
課題:
- データチームがボトルネック(全てのリクエストが集中)
- ドメイン知識の欠如(中央チームがビジネスを深く理解できない)
- スケーラビリティの限界(データ量と要求の増加に対応できない)
- オーナーシップの曖昧さ(データの品質に誰が責任を持つか不明確)
Data Meshの4つの原則
原則1:ドメイン指向の分散データオーナーシップ
データの所有権を、データを最もよく理解しているビジネスドメインに移譲します。
従来:中央データチームが全データを管理
↓
Data Mesh:各ドメインが自分のデータを管理
[営業ドメイン] → 営業データの所有・管理・提供
[マーケドメイン] → マーケデータの所有・管理・提供
[サポートドメイン] → サポートデータの所有・管理・提供
ポイント:
- データの「生産者」と「オーナー」を一致させる
- ドメイン知識を持つチームがデータの品質と意味に責任を持つ
- データの消費者のニーズに応じてデータを提供する
原則2:データをプロダクトとして扱う
各ドメインが提供するデータをプロダクトとして扱い、品質とユーザー体験を重視します。
データプロダクトが満たすべき特性:
| 特性 | 説明 |
|---|---|
| 発見可能(Discoverable) | カタログで検索・発見できる |
| アドレス可能(Addressable) | 一意のアドレスでアクセスできる |
| 信頼可能(Trustworthy) | 品質が保証されている |
| 自己記述的(Self-describing) | スキーマと意味が明示されている |
| 相互運用可能(Interoperable) | 他のデータプロダクトと結合できる |
| セキュア(Secure) | 適切なアクセス制御がされている |
原則3:セルフサービスデータプラットフォーム
各ドメインチームが自律的にデータプロダクトを構築・運用できるよう、共通のプラットフォームを提供します。
[セルフサービスプラットフォーム]
├── データストレージ(共通のDWH/データレイク)
├── データパイプラインツール(ETL/ELTの標準化)
├── データカタログ(メタデータ管理)
├── 品質管理ツール(データテスト、モニタリング)
├── アクセス管理(認証・認可)
└── テンプレート(データプロダクトの標準構成)
プラットフォームチームは「ドメインチームの生産性を最大化する」ことが使命です。
原則4:フェデレーテッドコンピュテーショナルガバナンス
ガバナンスを中央集権ではなく、**連邦制(フェデレーション)**で運営します。
[フェデレーテッドガバナンス]
├── グローバルポリシー(全社共通のルール)
│ ├── データ分類基準
│ ├── アクセス制御の基準
│ └── データ品質の最低基準
├── ローカルポリシー(ドメイン固有のルール)
│ ├── ドメイン固有のデータ定義
│ └── ドメイン固有の品質基準
└── ガバナンス委員会
├── 各ドメインの代表
└── プラットフォームチーム
Data Meshと既存アーキテクチャの比較
| 観点 | 中央集権型DWH | データレイク | Data Mesh |
|---|---|---|---|
| データ所有権 | 中央データチーム | 中央データチーム | 各ドメインチーム |
| スケーラビリティ | 組織面で限界 | 技術面はOK、組織面で限界 | 組織面・技術面で拡張可能 |
| ドメイン知識 | 中央に集約(薄い) | 中央に集約(薄い) | ドメインに分散(深い) |
| ガバナンス | 中央集権 | 中央集権 | フェデレーション |
| 品質責任 | 曖昧 | 曖昧 | ドメインが責任を持つ |
Data Meshの適用条件
Data Meshは全ての組織に適しているわけではありません:
適している場合
- 複数のドメインを持つ大規模組織
- 中央データチームがボトルネックになっている
- 各ドメインに技術力のあるチームがある
- データの種類と量が急速に増加している
適さない場合
- 小規模な組織(ドメインの分割が不要)
- データチームが十分なキャパシティを持っている
- ドメインチームに技術力がない
- データの種類と量が限定的
まとめ
| 原則 | 核心 |
|---|---|
| ドメイン指向 | データの所有権をビジネスドメインに移譲 |
| データプロダクト | データを品質保証されたプロダクトとして提供 |
| セルフサービスプラットフォーム | ドメインが自律的にデータプロダクトを構築できる基盤 |
| フェデレーテッドガバナンス | グローバルとローカルのルールを組み合わせた統制 |
チェックリスト
- Data Meshの4つの原則を説明できる
- 従来型アーキテクチャとData Meshの違いを説明できる
- Data Meshの適用条件を判断できる
- データプロダクトの6つの特性を挙げられる
次のステップへ
Data Meshの4つの原則を学びました。次は、ドメイン指向のデータオーナーシップを実現する具体的な方法を学びましょう。
推定読了時間:30分