LESSON 40分

ストーリー

佐藤CTO
データは石油だと言われるが、石油も管理しなければ環境汚染を起こす
佐藤CTO
データガバナンスは、データの品質・セキュリティ・コンプライアンスを組織的に管理する枠組みだ。DAMA-DMBOK、データスチュワードシップ、ポリシー設計。これらを体系的に学ぼう

DAMA-DMBOK フレームワーク

DAMA-DMBOK(Data Management Body of Knowledge)はデータ管理の国際標準フレームワークです。

知識領域概要主要な成果物
データガバナンス全体の方針・意思決定の枠組みガバナンス方針書、RACI
データアーキテクチャデータの構造・統合パターンデータモデル、フロー図
データモデリング&設計概念・論理・物理モデルER図、スキーマ定義
データストレージ&運用DB管理、パフォーマンス運用手順書、SLA
データセキュリティアクセス制御、暗号化セキュリティポリシー
データ統合&相互運用性ETL/ELT、API連携統合パターン定義
ドキュメント&コンテンツ非構造化データの管理文書管理ポリシー
参照&マスタデータマスタデータの一元管理MDMプラットフォーム
データウェアハウス&BI分析基盤、レポーティングDWH設計書
メタデータ管理データに関するデータの管理データカタログ
データ品質データの正確性・完全性品質ルール、SLA

データガバナンスの組織構造

// データガバナンス組織のロール定義

interface GovernanceRole {
  role: string;
  responsibility: string[];
  reportTo: string;
  scope: 'enterprise' | 'domain' | 'team';
}

const governanceOrganization: GovernanceRole[] = [
  {
    role: 'Chief Data Officer (CDO)',
    responsibility: [
      'データ戦略の策定と経営層への報告',
      'データガバナンスプログラムの全体統括',
      'データ関連の投資判断と優先順位決定',
    ],
    reportTo: 'CEO / CTO',
    scope: 'enterprise',
  },
  {
    role: 'Data Governance Council',
    responsibility: [
      'ガバナンスポリシーの承認と改定',
      'ドメイン間のデータ課題の調停',
      '四半期レビューとKPI評価',
    ],
    reportTo: 'CDO',
    scope: 'enterprise',
  },
  {
    role: 'Data Steward(データスチュワード)',
    responsibility: [
      'ドメイン内のデータ品質の責任者',
      'データ定義・ビジネス用語の管理',
      'データ利用申請の承認・監査',
      'データ品質問題のトリアージと改善',
    ],
    reportTo: 'Data Governance Council',
    scope: 'domain',
  },
  {
    role: 'Data Owner(データオーナー)',
    responsibility: [
      'データの最終的な責任者(ビジネス部門長)',
      'アクセス権限の承認',
      'データのライフサイクル決定(保持期間等)',
    ],
    reportTo: 'Data Governance Council',
    scope: 'domain',
  },
  {
    role: 'Data Engineer',
    responsibility: [
      'ガバナンスポリシーの技術的実装',
      'データパイプラインの品質チェック組み込み',
      'アクセス制御の実装と自動化',
    ],
    reportTo: 'Data Steward',
    scope: 'team',
  },
];

RACI マトリクス

活動CDOData StewardData OwnerData Engineer
ガバナンスポリシー策定ARCI
データ品質ルール定義IRAC
アクセス権限承認ICAR
品質モニタリング実装IAIR
インシデント対応IACR
規制報告ARCI

R=Responsible(実行), A=Accountable(最終責任), C=Consulted(相談), I=Informed(報告)


データガバナンスポリシーの設計

// ガバナンスポリシー定義

interface GovernancePolicy {
  id: string;
  name: string;
  category: 'classification' | 'access' | 'quality' | 'retention' | 'privacy';
  description: string;
  rules: PolicyRule[];
  enforcementLevel: 'mandatory' | 'recommended' | 'optional';
  reviewCycle: string;
}

interface PolicyRule {
  ruleId: string;
  condition: string;
  action: string;
  automation: 'fully-automated' | 'semi-automated' | 'manual';
}

const policies: GovernancePolicy[] = [
  {
    id: 'POL-001',
    name: 'データ分類ポリシー',
    category: 'classification',
    description: '全データ資産の機密レベルを分類する',
    enforcementLevel: 'mandatory',
    reviewCycle: '年次',
    rules: [
      {
        ruleId: 'CLS-001',
        condition: 'PIIを含むデータ(氏名、メール、住所、電話番号)',
        action: 'Confidential に分類、暗号化必須、アクセスログ記録',
        automation: 'semi-automated',
      },
      {
        ruleId: 'CLS-002',
        condition: '金融取引データ(口座番号、取引額、カード番号)',
        action: 'Restricted に分類、カラムレベル暗号化、監査証跡必須',
        automation: 'fully-automated',
      },
      {
        ruleId: 'CLS-003',
        condition: '集計・匿名化済みデータ',
        action: 'Internal に分類、チーム内で自由にアクセス可能',
        automation: 'fully-automated',
      },
    ],
  },
  {
    id: 'POL-002',
    name: 'データ保持ポリシー',
    category: 'retention',
    description: 'データのライフサイクルと保持期間を管理する',
    enforcementLevel: 'mandatory',
    reviewCycle: '年次',
    rules: [
      {
        ruleId: 'RET-001',
        condition: '金融取引データ',
        action: '7年間保持後、自動アーカイブ → 10年後に削除',
        automation: 'fully-automated',
      },
      {
        ruleId: 'RET-002',
        condition: 'ユーザー行動ログ',
        action: '個人識別可能: 1年保持後に匿名化、匿名化済み: 3年保持',
        automation: 'semi-automated',
      },
      {
        ruleId: 'RET-003',
        condition: 'テスト・開発環境データ',
        action: '90日後に自動削除、本番データの利用禁止',
        automation: 'fully-automated',
      },
    ],
  },
];

データスチュワードシップの実践

// データスチュワードの日常ワークフロー

interface StewardshipWorkflow {
  activity: string;
  frequency: string;
  tools: string[];
  output: string;
}

const dailyWorkflows: StewardshipWorkflow[] = [
  {
    activity: 'データ品質ダッシュボードの確認',
    frequency: '毎日(AM9時)',
    tools: ['Great Expectations', 'Grafana'],
    output: '品質アラートのトリアージと対応優先度の決定',
  },
  {
    activity: 'データアクセス申請の審査',
    frequency: '毎日',
    tools: ['Apache Ranger', 'ServiceNow'],
    output: 'アクセス権限の承認/拒否と記録',
  },
  {
    activity: 'ビジネス用語集の更新',
    frequency: '週次',
    tools: ['DataHub', 'Confluence'],
    output: '用語定義の追加・修正、ドメイン間の整合性確認',
  },
  {
    activity: 'データ品質レビュー会議',
    frequency: '月次',
    tools: ['品質レポート', 'Jira'],
    output: '品質KPIの評価、改善アクションの計画',
  },
  {
    activity: 'ガバナンスポリシーの適合性監査',
    frequency: '四半期',
    tools: ['監査チェックリスト', 'データカタログ'],
    output: 'ポリシー違反の検出と是正計画',
  },
];
データガバナンス成熟度モデル
レベル1: Initial(初期)
  - ガバナンスなし、個人の裁量でデータ管理
  - 品質問題は発生時に個別対応
  - メタデータは管理されていない

レベル2: Managed(管理)
  - 基本的なポリシーが文書化されている
  - データオーナーが一部のドメインで定義
  - 品質チェックが一部のパイプラインに存在

レベル3: Defined(定義)
  - 組織横断のガバナンスフレームワークが確立
  - データカタログが運用されている
  - 品質SLAが全主要データに設定

レベル4: Measured(測定)
  - ガバナンスKPIを定期的に測定・報告
  - 自動化された品質監視と是正
  - データリネージュが完全にトラッキング

レベル5: Optimized(最適化)
  - MLベースの品質異常検知
  - セルフサービスのデータディスカバリー
  - ガバナンスがデータメッシュに統合

まとめ

ポイント内容
DAMA-DMBOK11の知識領域でデータ管理を体系化
組織構造CDO → Council → Steward → Owner → Engineer の階層
ポリシー設計分類・アクセス・品質・保持・プライバシーの5分野
スチュワードシップデータ品質・用語管理・アクセス制御の日常的な実践

チェックリスト

  • DAMA-DMBOKの知識領域を説明できる
  • データガバナンスの組織構造とRACIマトリクスを設計できる
  • データ分類・保持ポリシーを定義できる
  • データスチュワードの役割と実践を理解した

次のステップへ

次はデータカタログとメタデータ管理について学びます。


推定読了時間: 40分