LESSON

データ可視化の原則

田中VPoE「分析で得られた洞察を、経営層に伝えなければならない。数字の羅列では伝わらない。可視化の力を借りよう。」

あなた「グラフを作ればいいんですよね?棒グラフとか円グラフとか。」

田中VPoE「ただグラフを作るだけではダメだ。Edward Tufteが提唱した原則に従って、データの真実を歪めず、メッセージを明確に伝える可視化を作る必要がある。」

なぜ可視化が重要か

人間の脳は視覚情報の処理に優れています。適切な可視化は:

  • 数値だけでは見えないパターンを発見できる
  • 複雑なデータを直感的に理解できる
  • 意思決定者へのコミュニケーションを効率化できる

Tufteの可視化原則

Edward Tufteは、情報デザインの権威として以下の原則を提唱しました:

1. データインク比を最大化する

データインク比とは、グラフ上でデータを表現するために使われたインクの割合です。

要素データインク非データインク
データポイントはい-
軸ラベルはい-
グリッド線-はい
装飾的な枠線-はい
3D効果-はい
背景色-はい

実践:不要なグリッド線、枠線、3D効果を削除し、データそのものに注目させる。

2. チャートジャンクを排除する

チャートジャンクとは、データの理解を妨げる装飾要素です:

  • 3D効果
  • 不要なグラデーション
  • 過剰な凡例
  • 不必要なアニメーション

3. 嘘をつかないグラフ

Lie Factor(嘘係数)= グラフ上の効果の大きさ / データ上の効果の大きさ

手法問題対策
Y軸を0から始めない差を過大に見せる棒グラフはY軸を0から
軸のスケール歪曲傾向を歪める適切なスケールを選択
二重Y軸誤った相関を示唆別々のグラフに分ける
面積の不適切な使用大きさの知覚を歪める長さで比較する

適切なチャート選択

チャート選択フローチャート

目的推奨チャート
比較棒グラフ(縦/横)カテゴリ別売上比較
構成積み上げ棒グラフ、円グラフ売上の構成比
推移折れ線グラフ月次売上推移
分布ヒストグラム、箱ひげ図注文金額の分布
関係散布図広告費と売上の関係
地理地図(コロプレス)地域別売上

チャート選択の詳細ガイド

比較を見せたい場合

データの特性チャート
カテゴリが少ない(5以下)棒グラフ
カテゴリが多い(6以上)横棒グラフ(ソート済み)
時系列の比較折れ線グラフ(重ね描き)
2変数の比較グループ化棒グラフ

分布を見せたい場合

データの特性チャート
1変数の分布ヒストグラム
グループ間の分布比較箱ひげ図 / バイオリンプロット
2変数の分布散布図 + 周辺分布

色使いの原則

カラーパレットの選択

種類用途
Sequential(順序)連続値(低→高)青→赤のグラデーション
Diverging(発散)中心からの乖離赤←白→青
Qualitative(質的)カテゴリの区別異なる色相

色使いのベストプラクティス

  • 色数は7色以内に抑える
  • 色覚多様性に配慮する(赤緑の組み合わせを避ける)
  • 強調色は1-2色に限定する
  • グレーをベースに、注目させたいデータを色付けする

ビジネスでの可視化の鉄則

  1. 1グラフ1メッセージ:1つのグラフには1つの明確なメッセージを
  2. タイトルで結論を述べる:「月次売上推移」ではなく「3月以降、売上が20%減少」
  3. 注釈を活用する:重要なイベントや変化点に注釈を入れる
  4. 比較対象を明示する:前年同期比、計画比など基準を示す

まとめ

項目ポイント
Tufteの原則データインク比を最大化、チャートジャンクを排除
嘘のないグラフ軸を0から、適切なスケール、二重Y軸を避ける
チャート選択比較→棒、推移→折れ線、分布→ヒストグラム、関係→散布図
色使い7色以内、色覚多様性に配慮、グレーベースに強調色
ビジネスルール1グラフ1メッセージ、タイトルで結論を述べる

チェックリスト

  • Tufteの可視化原則を3つ以上挙げられる
  • 分析目的に応じて適切なチャートを選択できる
  • 嘘をつくグラフの特徴を説明できる
  • 色使いの基本原則を理解している

次のステップへ

データ可視化の原則を学びました。次は、Pythonのmatplotlibとseabornを使って実際にグラフを作成しましょう。


推定読了時間:30分