LESSON 30分

Data Meshの4つの原則

田中VPoE「データ基盤が成長すると、中央集権型のデータチームがボトルネックになる。全てのデータリクエストが1つのチームに集中するからだ。」

あなた「確かに、データチームは常にバックログが溜まっている状態です。」

田中VPoE「Data Meshはこの問題を根本から解決するアーキテクチャだ。データの所有権をドメインに分散させるという発想転換を学ぼう。」

Data Meshとは

Data Meshは、Zhamak Dehghaniが提唱した分散型データアーキテクチャのパラダイムです。従来の中央集権型データプラットフォームの限界を克服するために、4つの原則に基づいてデータ管理を再設計します。

従来型アーキテクチャの課題

中央集権型データプラットフォーム

[営業] ─┐
[マーケ] ─┤→ [中央データチーム] → [データウェアハウス] → [消費者]
[サポート]─┤
[商品] ──┘

課題

  • データチームがボトルネック(全てのリクエストが集中)
  • ドメイン知識の欠如(中央チームがビジネスを深く理解できない)
  • スケーラビリティの限界(データ量と要求の増加に対応できない)
  • オーナーシップの曖昧さ(データの品質に誰が責任を持つか不明確)

Data Meshの4つの原則

原則1:ドメイン指向の分散データオーナーシップ

データの所有権を、データを最もよく理解しているビジネスドメインに移譲します。

従来:中央データチームが全データを管理

Data Mesh:各ドメインが自分のデータを管理

[営業ドメイン] → 営業データの所有・管理・提供
[マーケドメイン] → マーケデータの所有・管理・提供
[サポートドメイン] → サポートデータの所有・管理・提供

ポイント

  • データの「生産者」と「オーナー」を一致させる
  • ドメイン知識を持つチームがデータの品質と意味に責任を持つ
  • データの消費者のニーズに応じてデータを提供する

原則2:データをプロダクトとして扱う

各ドメインが提供するデータをプロダクトとして扱い、品質とユーザー体験を重視します。

データプロダクトが満たすべき特性:

特性説明
発見可能(Discoverable)カタログで検索・発見できる
アドレス可能(Addressable)一意のアドレスでアクセスできる
信頼可能(Trustworthy)品質が保証されている
自己記述的(Self-describing)スキーマと意味が明示されている
相互運用可能(Interoperable)他のデータプロダクトと結合できる
セキュア(Secure)適切なアクセス制御がされている

原則3:セルフサービスデータプラットフォーム

各ドメインチームが自律的にデータプロダクトを構築・運用できるよう、共通のプラットフォームを提供します。

[セルフサービスプラットフォーム]
├── データストレージ(共通のDWH/データレイク)
├── データパイプラインツール(ETL/ELTの標準化)
├── データカタログ(メタデータ管理)
├── 品質管理ツール(データテスト、モニタリング)
├── アクセス管理(認証・認可)
└── テンプレート(データプロダクトの標準構成)

プラットフォームチームは「ドメインチームの生産性を最大化する」ことが使命です。

原則4:フェデレーテッドコンピュテーショナルガバナンス

ガバナンスを中央集権ではなく、**連邦制(フェデレーション)**で運営します。

[フェデレーテッドガバナンス]
├── グローバルポリシー(全社共通のルール)
│   ├── データ分類基準
│   ├── アクセス制御の基準
│   └── データ品質の最低基準
├── ローカルポリシー(ドメイン固有のルール)
│   ├── ドメイン固有のデータ定義
│   └── ドメイン固有の品質基準
└── ガバナンス委員会
    ├── 各ドメインの代表
    └── プラットフォームチーム

Data Meshと既存アーキテクチャの比較

観点中央集権型DWHデータレイクData Mesh
データ所有権中央データチーム中央データチーム各ドメインチーム
スケーラビリティ組織面で限界技術面はOK、組織面で限界組織面・技術面で拡張可能
ドメイン知識中央に集約(薄い)中央に集約(薄い)ドメインに分散(深い)
ガバナンス中央集権中央集権フェデレーション
品質責任曖昧曖昧ドメインが責任を持つ

Data Meshの適用条件

Data Meshは全ての組織に適しているわけではありません:

適している場合

  • 複数のドメインを持つ大規模組織
  • 中央データチームがボトルネックになっている
  • 各ドメインに技術力のあるチームがある
  • データの種類と量が急速に増加している

適さない場合

  • 小規模な組織(ドメインの分割が不要)
  • データチームが十分なキャパシティを持っている
  • ドメインチームに技術力がない
  • データの種類と量が限定的

まとめ

原則核心
ドメイン指向データの所有権をビジネスドメインに移譲
データプロダクトデータを品質保証されたプロダクトとして提供
セルフサービスプラットフォームドメインが自律的にデータプロダクトを構築できる基盤
フェデレーテッドガバナンスグローバルとローカルのルールを組み合わせた統制

チェックリスト

  • Data Meshの4つの原則を説明できる
  • 従来型アーキテクチャとData Meshの違いを説明できる
  • Data Meshの適用条件を判断できる
  • データプロダクトの6つの特性を挙げられる

次のステップへ

Data Meshの4つの原則を学びました。次は、ドメイン指向のデータオーナーシップを実現する具体的な方法を学びましょう。


推定読了時間:30分