Step 4 クイズ:データ可視化で洞察を伝えよう
データ可視化の原則、matplotlib/seaborn、Plotly、データストーリーテリングについて理解度を確認しましょう。
Q1. Tufteの可視化原則における「データインク比」の正しい説明はどれか?
A. グラフの色の数と白黒の比率 B. データを表現するために使われたインクの、グラフ全体のインクに対する割合 C. グラフの解像度を示す指標 D. データ量とグラフサイズの比率
答えを見る
正解:B. データを表現するために使われたインクの、グラフ全体のインクに対する割合
Tufteは「データインク比を最大化すべき」と提唱しました。つまり、装飾的な枠線、3D効果、不要なグリッド線などの「非データインク」を減らし、データそのものを伝えるためのインク使用を最大化すべきという原則です。
Q2. 5つのカテゴリの売上構成比を時系列で比較したい場合、最も適切なグラフはどれか?
A. 円グラフ B. 積み上げ棒グラフ(100%) C. 散布図 D. 箱ひげ図
答えを見る
正解:B. 積み上げ棒グラフ(100%)
構成比の時系列変化を見るには、100%積み上げ棒グラフが最適です。各時点でのカテゴリ構成比が一目でわかり、時間経過に伴う変化も追えます。円グラフは1時点の構成比には使えますが、時系列比較には適しません(複数の円グラフの比較は困難です)。
Q3. Y軸を0から始めない棒グラフが「嘘をつくグラフ」と呼ばれる理由はどれか?
A. データが間違っているため B. 棒の長さ(面積)がデータの実際の差を過大に見せるため C. 軸ラベルが欠けているため D. グラフの解像度が低いため
答えを見る
正解:B. 棒の長さ(面積)がデータの実際の差を過大に見せるため
棒グラフでは、棒の長さが値の大きさを表します。Y軸を0から始めないと、例えば100と110の差(10%)が、見た目上は100%以上の差に見えてしまいます。折れ線グラフではY軸を0から始めなくてもよい場合がありますが、棒グラフではY軸を0から始めることが原則です。
Q4. データストーリーテリングのSCR構造で、「C(Complication)」に該当するのはどれか?
A. 現在の売上は月間5,000万円である B. 既存顧客のリピート率が前年比30%低下している C. リテンション施策に予算をシフトすべきである D. NetShop社はEC事業を展開している
答えを見る
正解:B. 既存顧客のリピート率が前年比30%低下している
SCR構造は Situation(現状)→ Complication(問題・複雑さ)→ Resolution(解決策)の3要素で構成されます。Complicationは「現状の中で何が問題なのか」を示すパートです。Aは Situation、Cは Resolution に該当します。
Q5. Plotlyのインタラクティブグラフのメリットとして、最も適切でないのはどれか?
A. ホバーでデータの詳細を確認できる B. ズームやパンでデータを探索できる C. 論文の図版としてそのまま使える D. HTMLファイルとして共有できる
答えを見る
正解:C. 論文の図版としてそのまま使える
論文の図版には通常、matplotlibなどで作成した静的な高解像度画像が求められます。Plotlyはインタラクティブ性が強みで、探索的分析やプレゼンテーション、ダッシュボードには最適ですが、論文のような静的メディアには matplotlib/seaborn の方が適しています。
結果
5問中何問正解できましたか?
| 正解数 | 評価 |
|---|---|
| 5問 | 可視化マスターです!Step 5に進みましょう |
| 3-4問 | 良い理解度です。間違えた部分を復習しましょう |
| 1-2問 | Step 4のレッスンをもう一度確認しましょう |
| 0問 | 可視化の原則から見直しましょう |
推定所要時間:30分