EXERCISE 60分

ストーリー

佐藤CTO
データは企業の最も重要な資産だ。その品質と安全性を守るガバナンス体制を設計してほしい

ミッション概要

ミッションテーマ目安時間
Mission 1データガバナンスフレームワーク設計15分
Mission 2データカタログ仕様策定15分
Mission 3プライバシーコンプライアンス計画15分
Mission 4データリネージュ追跡システム設計15分

前提シナリオ

企業: ヘルスケアSaaS「MediCloud」
データ: 患者記録100万件、医療データ、処方情報
規制: 個人情報保護法、医療情報ガイドライン
チーム: データエンジニア5名、分析チーム8名、開発チーム20名

Mission 1: ガバナンスフレームワーク設計(15分)

解答例
領域ポリシー責任者
データ品質品質スコア95%以上を維持データエンジニアリングリード
データセキュリティ暗号化、アクセス制御、監査ログセキュリティリード
データプライバシー個人情報の匿名化、同意管理DPO(データ保護責任者)
データライフサイクル保持期間、アーカイブ、削除ポリシーデータスチュワード
データアクセスロールベースアクセス、承認フロー各チームリード

Mission 2: データカタログ仕様(15分)

解答例
メタデータ項目説明
データセット名一意の識別名patient_records
オーナー責任チーム医療データチーム
機密レベルPublic/Internal/Confidential/RestrictedRestricted
更新頻度更新サイクルリアルタイム
データ品質スコア完全性・正確性・適時性の総合スコア97%
リネージュ上流・下流の依存関係EMR → patient_records → analytics_dashboard
PII含有個人情報の有無と種類氏名、生年月日、診療情報

Mission 3: プライバシーコンプライアンス計画(15分)

解答例
要件対応策実装
データ最小化必要最小限のデータのみ収集スキーマレビュー
暗号化静止データ・通信データの暗号化AES-256 + TLS 1.3
匿名化分析用データの匿名化k-匿名性(k≥5)
アクセスログ全データアクセスの監査ログCloudTrail + アプリログ
データ削除患者の削除要求対応(30日以内)削除パイプライン自動化
同意管理データ利用目的ごとの同意取得Consent Management Platform

Mission 4: リネージュ追跡システム(15分)

解答例
EMRシステム → Kafka → Data Lake(S3) → Spark ETL → DWH → BIダッシュボード
     │                                      │
     └── リネージュメタデータ ──────────────┘
         (Apache Atlas / OpenLineage)

追跡項目:
  - ソース(どこから来たか)
  - 変換(どう加工されたか)
  - 宛先(どこに行くか)
  - タイムスタンプ(いつ処理されたか)

まとめ

ポイント内容
ガバナンス品質・セキュリティ・プライバシー・ライフサイクルを統合管理
カタログメタデータを体系的に管理し、データの発見性を向上
プライバシー規制要件を技術的対策にマッピング
リネージュデータの流れを端到端で追跡可能にする

チェックリスト

  • データガバナンスフレームワークを設計できた
  • データカタログの仕様を策定できた
  • プライバシーコンプライアンス計画を策定できた
  • データリネージュ追跡システムを設計できた

次のステップへ

次はチェックポイントクイズで理解度を確認します。


推定読了時間: 60分