データ可視化の原則
田中VPoE「分析で得られた洞察を、経営層に伝えなければならない。数字の羅列では伝わらない。可視化の力を借りよう。」
あなた「グラフを作ればいいんですよね?棒グラフとか円グラフとか。」
田中VPoE「ただグラフを作るだけではダメだ。Edward Tufteが提唱した原則に従って、データの真実を歪めず、メッセージを明確に伝える可視化を作る必要がある。」
なぜ可視化が重要か
人間の脳は視覚情報の処理に優れています。適切な可視化は:
- 数値だけでは見えないパターンを発見できる
- 複雑なデータを直感的に理解できる
- 意思決定者へのコミュニケーションを効率化できる
Tufteの可視化原則
Edward Tufteは、情報デザインの権威として以下の原則を提唱しました:
1. データインク比を最大化する
データインク比とは、グラフ上でデータを表現するために使われたインクの割合です。
| 要素 | データインク | 非データインク |
|---|---|---|
| データポイント | はい | - |
| 軸ラベル | はい | - |
| グリッド線 | - | はい |
| 装飾的な枠線 | - | はい |
| 3D効果 | - | はい |
| 背景色 | - | はい |
実践:不要なグリッド線、枠線、3D効果を削除し、データそのものに注目させる。
2. チャートジャンクを排除する
チャートジャンクとは、データの理解を妨げる装飾要素です:
- 3D効果
- 不要なグラデーション
- 過剰な凡例
- 不必要なアニメーション
3. 嘘をつかないグラフ
Lie Factor(嘘係数)= グラフ上の効果の大きさ / データ上の効果の大きさ
| 手法 | 問題 | 対策 |
|---|---|---|
| Y軸を0から始めない | 差を過大に見せる | 棒グラフはY軸を0から |
| 軸のスケール歪曲 | 傾向を歪める | 適切なスケールを選択 |
| 二重Y軸 | 誤った相関を示唆 | 別々のグラフに分ける |
| 面積の不適切な使用 | 大きさの知覚を歪める | 長さで比較する |
適切なチャート選択
チャート選択フローチャート
| 目的 | 推奨チャート | 例 |
|---|---|---|
| 比較 | 棒グラフ(縦/横) | カテゴリ別売上比較 |
| 構成 | 積み上げ棒グラフ、円グラフ | 売上の構成比 |
| 推移 | 折れ線グラフ | 月次売上推移 |
| 分布 | ヒストグラム、箱ひげ図 | 注文金額の分布 |
| 関係 | 散布図 | 広告費と売上の関係 |
| 地理 | 地図(コロプレス) | 地域別売上 |
チャート選択の詳細ガイド
比較を見せたい場合
| データの特性 | チャート |
|---|---|
| カテゴリが少ない(5以下) | 棒グラフ |
| カテゴリが多い(6以上) | 横棒グラフ(ソート済み) |
| 時系列の比較 | 折れ線グラフ(重ね描き) |
| 2変数の比較 | グループ化棒グラフ |
分布を見せたい場合
| データの特性 | チャート |
|---|---|
| 1変数の分布 | ヒストグラム |
| グループ間の分布比較 | 箱ひげ図 / バイオリンプロット |
| 2変数の分布 | 散布図 + 周辺分布 |
色使いの原則
カラーパレットの選択
| 種類 | 用途 | 例 |
|---|---|---|
| Sequential(順序) | 連続値(低→高) | 青→赤のグラデーション |
| Diverging(発散) | 中心からの乖離 | 赤←白→青 |
| Qualitative(質的) | カテゴリの区別 | 異なる色相 |
色使いのベストプラクティス
- 色数は7色以内に抑える
- 色覚多様性に配慮する(赤緑の組み合わせを避ける)
- 強調色は1-2色に限定する
- グレーをベースに、注目させたいデータを色付けする
ビジネスでの可視化の鉄則
- 1グラフ1メッセージ:1つのグラフには1つの明確なメッセージを
- タイトルで結論を述べる:「月次売上推移」ではなく「3月以降、売上が20%減少」
- 注釈を活用する:重要なイベントや変化点に注釈を入れる
- 比較対象を明示する:前年同期比、計画比など基準を示す
まとめ
| 項目 | ポイント |
|---|---|
| Tufteの原則 | データインク比を最大化、チャートジャンクを排除 |
| 嘘のないグラフ | 軸を0から、適切なスケール、二重Y軸を避ける |
| チャート選択 | 比較→棒、推移→折れ線、分布→ヒストグラム、関係→散布図 |
| 色使い | 7色以内、色覚多様性に配慮、グレーベースに強調色 |
| ビジネスルール | 1グラフ1メッセージ、タイトルで結論を述べる |
チェックリスト
- Tufteの可視化原則を3つ以上挙げられる
- 分析目的に応じて適切なチャートを選択できる
- 嘘をつくグラフの特徴を説明できる
- 色使いの基本原則を理解している
次のステップへ
データ可視化の原則を学びました。次は、Pythonのmatplotlibとseabornを使って実際にグラフを作成しましょう。
推定読了時間:30分