LESSON

演習:分析計画を立てよう

田中VPoE「さて、ここまで学んだことを実践してみよう。NetShop社のマーケティング部長から、こんな依頼が来ているんだ。」

依頼内容

田中VPoE「この依頼をもとに、CRISP-DMに沿った分析計画を立ててみてくれ。」

ミッション概要

マーケティング部長の依頼を受けて、CRISP-DMフレームワークに基づいた分析計画書を作成します。ビジネス理解からデータ準備の計画まで、分析の上流工程を設計しましょう。


Mission 1: ビジネス課題を分析課題に変換する

マーケティング部長の依頼を、SMARTな分析課題に変換してください。

要件

  1. 依頼文からビジネス上の課題を3つ抽出する
  2. それぞれの課題を**具体的な分析課題(問い)**に変換する
  3. 各分析課題がSMART基準を満たしていることを確認する

作業

以下のフォーマットで分析課題を整理してください:

## 分析課題一覧

### 課題1: [タイトル]
- ビジネス課題: [元の曖昧な課題]
- 分析課題: [具体的な問い]
- Specific: [何を測定するか]
- Measurable: [どの指標で測るか]
- Actionable: [結果からどんなアクションが取れるか]
- Relevant: [ビジネス目標との関連]
- Time-bound: [対象期間]
解答例
## 分析課題一覧

### 課題1: リピート率の低下要因の特定
- ビジネス課題: 既存顧客のリピート率が下がっている気がする
- 分析課題: 過去12ヶ月で2回目購入率はどのセグメントで最も低下したか?
- Specific: 顧客セグメント別の2回目購入率の変化
- Measurable: 2回目購入率(%)、セグメント別に前年同期比
- Actionable: 低下セグメント向けのリテンション施策を設計できる
- Relevant: リピート率改善は売上の安定成長に直結
- Time-bound: 直近12ヶ月 vs 前年同期

### 課題2: 売上鈍化の構造分解
- ビジネス課題: 売上の伸びが鈍化している
- 分析課題: 売上を顧客数×購買頻度×客単価に分解した場合、どの要素が鈍化の主因か?
- Specific: 売上の3要素の月次推移
- Measurable: 各要素の前年同月比成長率
- Actionable: 鈍化要因に応じた施策を優先度付けできる
- Relevant: 売上改善の最もレバレッジの高いポイントを特定
- Time-bound: 直近24ヶ月の月次データ

### 課題3: 効果的な施策の特定
- ビジネス課題: 売上改善につながる施策を提案してほしい
- 分析課題: 過去のキャンペーンのうち、LTV向上に最も寄与した施策タイプは何か?
- Specific: キャンペーンタイプ別のLTV変化
- Measurable: キャンペーン参加者のLTV中央値の前後比較
- Actionable: 効果の高い施策タイプに予算を集中配分できる
- Relevant: マーケティングROIの改善に直結
- Time-bound: 直近6ヶ月のキャンペーン実績

Mission 2: KPIツリーを設計する

NetShop社の売上改善を目的としたKPIツリーを設計してください。

要件

  1. トップKPI:月間売上
  2. 第2階層:トップKPIを構成する3-4つの要素に分解
  3. 第3階層:各要素をさらに具体的な指標に分解
  4. 各指標について現在の仮想値目標値を設定する

作業

テキストベースのツリー図とKPI一覧表を作成してください。

解答例
## KPIツリー

月間売上(5,000万円 → 6,000万円)
├── 新規顧客売上(1,500万円 → 1,800万円)
│   ├── サイト訪問数(50万/月 → 55万/月)
│   ├── CVR(1.5% → 1.8%)
│   └── 新規顧客単価(2,000円 → 2,200円)
├── 既存顧客売上(3,000万円 → 3,600万円)
│   ├── アクティブ既存顧客数(2万人 → 2.2万人)
│   ├── 購買頻度(3回/年 → 3.5回/年)
│   └── リピート顧客単価(5,000円 → 5,500円)
└── 休眠顧客復帰売上(500万円 → 600万円)
    ├── 休眠顧客数(5万人)
    ├── 復帰率(2% → 3%)
    └── 復帰顧客単価(5,000円 → 4,000円)

## KPI一覧

| KPI | 現状値 | 目標値 | 改善率 | 優先度 |
|-----|--------|--------|--------|--------|
| 月間売上 | 5,000万円 | 6,000万円 | +20% | - |
| CVR | 1.5% | 1.8% | +20% | 高 |
| 購買頻度 | 3回/年 | 3.5回/年 | +17% | 高 |
| リピート顧客単価 | 5,000円 | 5,500円 | +10% | 中 |
| 休眠顧客復帰率 | 2% | 3% | +50% | 中 |
| サイト訪問数 | 50万/月 | 55万/月 | +10% | 低 |

Mission 3: データ要件と分析計画を策定する

分析課題とKPIに基づいて、必要なデータと分析の進め方を計画してください。

要件

  1. 必要なデータソースと各カラムの一覧
  2. データ品質で予想される課題とその対策
  3. 分析のスケジュール(2週間想定)
  4. 各分析課題に対する分析手法の選定

作業

分析計画書として以下のセクションを作成してください。

解答例
## 必要データ一覧

| データソース | 必要カラム | 期間 | 用途 |
|-------------|-----------|------|------|
| 購買履歴 | order_id, customer_id, amount, date, product_id | 過去24ヶ月 | 売上分解、RFM分析 |
| 顧客マスタ | customer_id, registration_date, age, gender, region | 全期間 | セグメンテーション |
| 商品マスタ | product_id, category, price, brand | 最新 | カテゴリ別分析 |
| キャンペーン履歴 | campaign_id, type, target_customers, start_date, end_date | 過去12ヶ月 | 施策効果分析 |
| アクセスログ | session_id, customer_id, page, timestamp | 過去6ヶ月 | CVR分析 |

## データ品質の想定課題と対策

| 課題 | 想定される問題 | 対策 |
|------|--------------|------|
| 欠損値 | 顧客属性(age, gender)に20-30%の欠損 | 欠損パターン分析後、分析から除外 or 補完を判断 |
| 重複 | 注文データの重複(決済リトライ) | order_id での重複排除 |
| 異常値 | 極端に高額な注文(法人購入の混入) | 99パーセンタイル以上をフラグ付け |
| 結合キー | customer_idの形式不一致 | 正規化ルールを定義して前処理 |

## 分析スケジュール(2週間)

| 日程 | フェーズ | 作業内容 |
|------|---------|---------|
| Day 1-2 | データ理解 | データ取得、EDA、品質チェック |
| Day 3-4 | データ準備 | クレンジング、結合、特徴量作成 |
| Day 5-6 | 分析1 | 売上構造分解、トレンド分析 |
| Day 7-8 | 分析2 | 顧客セグメンテーション、RFM分析 |
| Day 9 | 分析3 | キャンペーン効果分析 |
| Day 10 | 評価 | 結果の統合、インサイトの整理 |
| Day 11-12 | レポート | 分析レポート・ダッシュボード作成 |
| Day 13 | レビュー | 田中VPoEレビュー、修正 |
| Day 14 | 最終化 | 経営会議向けプレゼン資料完成 |

## 分析手法の選定

| 分析課題 | 手法 | ツール |
|---------|------|--------|
| 売上構造分解 | KPIツリー分解、時系列分析 | Pandas, matplotlib |
| リピート率分析 | コホート分析、RFM分析 | Pandas, seaborn |
| セグメント別分析 | クロス集計、統計検定 | Pandas, SciPy |
| キャンペーン効果 | 前後比較、t検定 | SciPy, statsmodels |
| 可視化 | ダッシュボード | Plotly, Jupyter |

達成度チェック

  • ビジネス課題を3つ以上の具体的な分析課題に変換できた
  • 各分析課題がSMART基準を満たしている
  • KPIツリーを3階層以上で構築できた
  • 必要なデータソースと品質課題を洗い出せた
  • 2週間の分析スケジュールを策定できた

推定所要時間:60分