演習:データカタログとセルフサービスBI環境の設計
田中VPoE「いよいよ実践だ。NetShop社のデータカタログとセルフサービスBI環境を設計してほしい。」
あなた「まずは対象データの棚卸しから始めて、カタログの設計、そしてBI環境のアーキテクチャまで作ります。」
田中VPoE「期待しているよ。現場が実際に使える設計にすることを意識してくれ。」
演習の背景
NetShop社のデータ環境:
- データウェアハウス:BigQuery(テーブル数:約200)
- データソース:ECサイト(PostgreSQL)、CRM(Salesforce)、GA4、広告プラットフォーム
- BIツール:Looker(導入済みだが利用率15%)
- 利用部門:マーケティング、営業、カスタマーサポート、経営企画、商品企画
課題1:データ資産の棚卸し
NetShop社の主要データ資産を整理し、カタログ登録の優先順位を決めてください。
要件
## データ資産一覧
| データ資産名 | ソース | 主要テーブル | 利用部門 | 優先度 |
|-------------|--------|-------------|---------|--------|
| 注文データ | ECサイト | orders, order_items | 全部門 | ? |
| 顧客データ | CRM | customers, contacts | ? | ? |
| ... | ... | ... | ... | ... |
## 優先順位の判断基準
- ...
最低10個のデータ資産をリストアップしてください。
課題2:メタデータ設計
主要なデータ資産3つを選び、詳細なメタデータを設計してください。
要件
各データ資産について以下を定義してください:
## データ資産:[名前]
### 技術メタデータ
- テーブル名:
- カラム一覧(名前、型、説明、PII有無):
- 更新頻度:
- データ量:
### ビジネスメタデータ
- ビジネス定義:
- データオーナー:
- 利用用途:
- データ分類(機密レベル):
- 関連するビジネス用語:
### 運用メタデータ
- SLA(鮮度、可用性):
- 品質指標:
- 上流依存:
- 下流依存:
課題3:ビジネス用語集の設計
NetShop社で統一すべきビジネス用語を10個以上定義してください。
要件
## ビジネス用語集
| 用語 | 定義 | 計算式 | 対応データ | 注意事項 |
|------|------|--------|-----------|---------|
| 売上 | 返品・キャンセルを除いた確定売上額 | SUM(amount) WHERE status='completed' | orders.amount | 税込/税抜を明記 |
| ... | ... | ... | ... | ... |
課題4:セルフサービスBI環境のアーキテクチャ設計
NetShop社のセルフサービスBI環境を設計してください。
要件
## セルフサービスBI アーキテクチャ
### 全体構成図
[データソース] → [ETL/ELT] → [DWH] → [セマンティックレイヤー] → [BIツール]
### データマート設計
各部門向けのデータマートを定義:
#### マーケティングマート
- テーブル一覧と用途:
- 主要指標:
#### 営業マート
...
### セマンティックレイヤー設計
- 統一指標の定義:
- ディメンション(分析軸)の定義:
### アクセス制御設計
- ロール定義:
- データマートごとのアクセス権限:
### ダッシュボード設計
各部門向けの標準ダッシュボード:
- ダッシュボード名:
- 対象ユーザー:
- 主要な指標とグラフ:
課題5:導入ロードマップ
データカタログとセルフサービスBI環境の導入計画を作成してください。
要件
## 導入ロードマップ(6ヶ月)
### Month 1-2:基盤整備
- [ ] 実施項目と成果物
### Month 3-4:パイロット
- [ ] パイロット部門の選定と理由
- [ ] パイロットの成功指標
### Month 5-6:拡大展開
- [ ] 横展開の計画
- [ ] 全社展開に向けた課題と対策
### 必要リソース
| リソース | 内容 | コスト |
|---------|------|--------|
| 人員 | ... | ... |
| ツール | ... | ... |
| トレーニング | ... | ... |
提出物
- データ資産一覧と優先順位表
- 主要3データ資産の詳細メタデータ設計
- ビジネス用語集(10項目以上)
- セルフサービスBI環境のアーキテクチャ設計書
- 6ヶ月間の導入ロードマップ
評価基準
| 観点 | 配点 |
|---|---|
| データ資産の網羅性と優先順位の妥当性 | 20% |
| メタデータ設計の充実度 | 20% |
| ビジネス用語集の実用性 | 15% |
| アーキテクチャ設計の整合性 | 25% |
| ロードマップの実現可能性 | 20% |
推定所要時間:90分