EXERCISE 90分

ストーリー

田中VPoE
品質フレームワーク、メトリクス設計、文化醸成、継続的改善 — 品質管理の全体像を学んだ。ここからはFreshCart社の品質管理体制を設計してもらう
あなた
FreshCart社は品質問題で年間6,840万円以上の損失があると試算されていましたね
田中VPoE
そうだ。経営層も「データ品質の改善」を優先課題として認識している。「まず何から手をつけるか」「1年後にどこまで持っていくか」を具体的な計画として策定してくれ。品質改善のクイックウィンと中長期ロードマップの両方が必要だ

ミッション概要

項目内容
演習タイトルデータ品質管理体制設計書
想定時間90分
成果物データ品質管理体制設計書(現状分析 + 品質フレームワーク + 改善計画 + 文化醸成計画)
対象組織FreshCart株式会社(Step 1-3と同じ)

前提条件

Step 1-3の前提条件に加え、以下の追加情報を考慮してください。

追加情報

項目詳細
品質問題の発生状況過去6ヶ月で品質起因のインシデント12件(月平均2件)
代表的なインシデント在庫データの遅延で2日間の発注ミス、顧客メールの名前間違い500件
データテストの現状dbt導入済みだがテストは売上関連の3テーブルのみ(カバレッジ10%)
品質監視Airflowのジョブ失敗アラートのみ。データ内容の品質監視はなし
品質に関する意識調査「品質問題はデータチームの責任」と回答したのが75%
品質改善の追加予算年間500万円(ツール + 教育)

Mission 1: 品質現状分析と目標設定

要件

FreshCart社のデータ品質の現状を分析し、改善目標を設定してください。

  1. 主要データセットの品質評価(6次元で5段階評価)
  2. 品質問題のコスト分析(カテゴリ別の年間推定コスト)
  3. 品質改善の目標設定(1年後のKPI)
解答例

主要データセットの品質評価

データセット完全性正確性一貫性適時性一意性妥当性総合
顧客マスター3224332.8
注文トランザクション4335443.8
商品マスター4323232.8
在庫データ3322432.8
分析マート3323443.2
顧客セグメント2213332.3

(5段階: 1=非常に低い, 2=低い, 3=中程度, 4=高い, 5=非常に高い)

品質問題のコスト分析

カテゴリ年間推定コスト主要要因
住所不備による配送失敗1,280万円顧客マスターの住所不備8%
手動データ修正工数600万円自動品質チェックの不在
在庫予測誤りの機会損失3,000万円在庫データの遅延と不整合
重複顧客への二重施策360万円商品マスター重複5%、顧客ID未統合
データ不整合の調査工数400万円テーブル間の一貫性不足
広告最適化の精度低下1,500万円顧客セグメントの品質問題
合計7,140万円

1年後の目標

KPI現状1年後目標
全社品質スコア(加重平均)60点80点
テストカバレッジ10%70%
品質インシデント(月間)2件0.5件以下
MTTR(平均修復時間)48時間(推定)4時間
品質起因コスト7,140万円3,000万円以下
「品質は全員の責任」認識率25%70%

Mission 2: 品質フレームワークとツール選定

要件

FreshCart社のデータ品質管理フレームワークを設計してください。

  1. 品質SLAの設計(ティア別の品質基準)
  2. 品質チェックツールの選定(比較検討と推奨)
  3. 品質ゲートの設計(パイプラインへの組み込み方)
  4. 品質改善のクイックウィン(3ヶ月以内に着手する施策3つ)
解答例

品質SLAの設計

ティア対象データ完全性正確性適時性監視
Tier 1注文、顧客PII99.5%以上99%以上1時間以内リアルタイム
Tier 2在庫、商品マスター、分析マート98%以上97%以上6時間以内日次
Tier 3行動ログ、マーケデータ95%以上95%以上24時間以内週次

ツール選定

推奨理由
dbt tests(拡張)既に導入済み。テストカバレッジ拡大が最も低コスト。dbt-expectationsパッケージで統計テストも可能
Great ExpectationsPython連携で高度なプロファイリング。dbtと併用
Slack連携アラート通知。追加コストなし

年間コスト: 約100万円(Great Expectations OSS運用 + クラウドインフラ)

品質ゲートの設計

ゲート実装場所チェック内容
入力ゲートECアプリのバリデーション住所形式、メール形式、必須項目
取込ゲートAirflowパイプライン入り口スキーマ検証、レコード数±20%
変換ゲートdbt run後のdbt testビジネスルール、整合性
公開ゲート分析マート更新前品質スコア閾値(80点以上)

クイックウィン(3ヶ月以内)

  1. dbt testsの全テーブル展開: 既存3テーブル→全主要テーブル(20テーブル)にテスト追加。コスト: エンジニア工数のみ
  2. 商品マスターの重複クレンジング: 750件の重複を名寄せ、登録画面に重複チェックを追加。効果: 年間360万円削減
  3. 在庫データのリアルタイム連携: Excelベースの在庫連携をAPI連携に変更。効果: 在庫予測精度向上

Mission 3: 品質文化醸成計画

要件

FreshCart社のデータ品質文化を醸成する計画を策定してください。

  1. 文化醸成のロードマップ(4フェーズ、各フェーズの施策)
  2. 品質バジェットの設計(チーム別の配分)
  3. 品質ポストモーテムのテンプレート(最近のインシデント「顧客メール名前間違い500件」に適用)
解答例

文化醸成ロードマップ

フェーズ期間施策成果指標
認知Month 1-3コスト可視化(7,140万円)の経営報告、全社集会での品質メッセージ、品質ダッシュボード公開品質コスト認知率80%
仕組みMonth 3-6品質SLA展開、品質バジェット制度化、報告フロー整備、dbt tests拡大テストカバレッジ50%
定着Month 6-9品質賞(Quick Catch賞)開始、ポストモーテム文化、データチャンピオンの品質活動品質報告件数月5件以上
進化Month 9-12品質KPIの評価制度反映、Great Expectations導入、アノマリ検知開始品質スコア全Tier1データ90点以上

品質バジェットの設計

チームバジェット活動内容
EC開発(25名)開発時間の15%(月37.5人日)入力バリデーション強化、テスト追加
データチーム(10名)開発時間の25%(月25人日)テストカバレッジ拡大、品質監視構築
サプライチェーン(15名)開発時間の10%(月15人日)Excel脱却、データ連携の自動化

ポストモーテム: 顧客メール名前間違い500件

項目内容
インシデント概要キャンペーンメール送信時、500件の顧客名前が別の顧客の名前で送信された
影響顧客500名に不信感。SNSでの拡散リスク。CS問い合わせ50件
タイムライン10
メール送信 → 10
CS報告で発覚 → 11
原因調査開始 → 13
原因特定 → 14
お詫びメール送信
根本原因マーケチームがBrazeにCSVアップロードする際、ソート順が異なるファイルをマッチングしたため、顧客IDと名前がずれた
Why 1なぜ名前がずれた? → CSVのマッチングミス
Why 2なぜミスが起きた? → 手動でExcelをソート・加工していた
Why 3なぜ手動? → 自動連携がないため
Why 4なぜ検知できなかった? → テスト送信のプロセスがなかった
再発防止策(1) Braze連携の自動化(顧客IDベース) (2) テスト送信プロセスの必須化 (3) 送信前のデータチェックリスト
学び手動データ操作は品質リスクの温床。自動化とプロセスで防止する

達成度チェック

観点達成基準
現状分析の具体性6次元評価に具体的な根拠がある
コスト分析の妥当性品質問題のコストが合理的に試算されている
SLA設計の実用性ティア分類と基準値が現実的である
ツール選定の合理性既存資産を活用しつつ、費用対効果が説明できる
クイックウィンの即効性3ヶ月以内に着手可能で効果が見える施策が選ばれている
文化醸成の段階性認知→仕組み→定着→進化の段階が現実的に設計されている
ポストモーテムの深さ5 Whysで根本原因に到達し、具体的な再発防止策がある

推定所要時間: 90分