QUIZ 15分

Step 1 クイズ:Modern Data Stackの全体像

Modern Data Stack、データウェアハウス、レイクハウスについての理解度を確認しましょう。


Q1. ELTパターンにおいて、データ変換が行われる場所はどこか?

A. 中間のETLサーバー B. データソース側 C. データウェアハウス内 D. BIツール内

答えを見る

正解:C. データウェアハウス内

ELT(Extract-Load-Transform)では、データをまずDWHにロードし、DWHの計算能力を使って変換を行います。クラウドDWHの性能向上により、このパターンが主流になっています。


Q2. Modern Data Stackが従来のHadoop基盤と最も異なる点はどれか?

A. データを格納できる B. SQLが使える C. クラウドネイティブなSaaSの組み合わせで構築する D. バッチ処理ができる

答えを見る

正解:C. クラウドネイティブなSaaSの組み合わせで構築する

MDSの最大の特徴は、各レイヤーで専門化されたSaaSツールを組み合わせ、クラウド上でオンデマンドにスケールできる点です。Hadoopはオンプレミスが前提で、Java/Scalaでの開発が必要でした。


Q3. DWHの3層モデルで、ビジネスロジックを適用した集計テーブルが配置されるのはどの層か?

A. Raw Layer B. Staging Layer C. Mart Layer D. Bronze Layer

答えを見る

正解:C. Mart Layer

Mart Layerはビジネスユースケースごとの集計テーブルを配置する層です。Raw Layerは生データの格納、Staging Layerはクレンジングと標準化を担当します。


Q4. スタースキーマにおける「ファクトテーブル」の説明として最も適切なのはどれか?

A. 商品名や顧客名などの属性情報を格納するテーブル B. 売上や注文などのビジネスイベントを格納するテーブル C. データのバックアップを格納するテーブル D. メタデータを管理するテーブル

答えを見る

正解:B. 売上や注文などのビジネスイベントを格納するテーブル

ファクトテーブルはビジネスイベント(トランザクション)のデータを格納します。属性情報はディメンションテーブルに格納され、ファクトテーブルから外部キーで参照されます。


Q5. SCD Type 2の特徴として正しいのはどれか?

A. 変更があったら既存レコードを上書きする B. 変更があったら新しい行を追加し、履歴を保持する C. 変更前後の値をカラムとして横に持つ D. 変更を記録しない

答えを見る

正解:B. 変更があったら新しい行を追加し、履歴を保持する

SCD Type 2は、属性が変更されるたびに新しい行を追加し、valid_from/valid_toで有効期間を管理します。これにより、過去の任意の時点での属性値を参照できます。


Q6. レイクハウスアーキテクチャの説明として最も適切なのはどれか?

A. データレイクの別名 B. データウェアハウスの別名 C. データレイクの柔軟性とDWHの信頼性を両立するアーキテクチャ D. オンプレミスのデータ基盤

答えを見る

正解:C. データレイクの柔軟性とDWHの信頼性を両立するアーキテクチャ

レイクハウスは、オブジェクトストレージ上にテーブルフォーマット(Delta Lake / Iceberg)を導入することで、データレイクにACIDトランザクションやスキーマ管理などDWHの機能を追加したアーキテクチャです。


Q7. Apache Icebergなどのテーブルフォーマットが提供する機能として正しくないものはどれか?

A. ACIDトランザクション B. タイムトラベル(過去データの参照) C. リアルタイムストリーミング処理 D. スキーマ進化

答えを見る

正解:C. リアルタイムストリーミング処理

テーブルフォーマットはACIDトランザクション、タイムトラベル、スキーマ進化などのデータ管理機能を提供しますが、リアルタイムストリーミング処理はKafkaやFlink等の別コンポーネントの役割です。


Q8. メダリオンアーキテクチャの3層の正しい順序はどれか?

A. Gold → Silver → Bronze B. Silver → Bronze → Gold C. Bronze → Silver → Gold D. Bronze → Gold → Silver

答えを見る

正解:C. Bronze → Silver → Gold

メダリオンアーキテクチャでは、Bronze(生データ)→ Silver(クレンジング済み)→ Gold(ビジネス集計)の順にデータが加工されていきます。DWHのRaw → Staging → Martに対応します。


Q9. BigQueryとSnowflakeに共通する特徴はどれか?

A. オンプレミスで動作する B. ストレージと計算リソースが分離されている C. 無料で無制限に利用できる D. NoSQLデータベースである

答えを見る

正解:B. ストレージと計算リソースが分離されている

現代のクラウドDWHの共通アーキテクチャとして、ストレージと計算(コンピュート)の分離があります。これにより、データ量とクエリ処理能力を独立してスケールできます。


Q10. MDSのIngestion Layerの役割として最も適切なのはどれか?

A. データの可視化とレポーティング B. データソースからデータを抽出しDWHにロードする C. SQLでデータを変換する D. ワークフローのスケジューリング

答えを見る

正解:B. データソースからデータを抽出しDWHにロードする

Ingestion Layerは、各種データソース(DB、API、ファイル等)からデータを抽出し、DWHやデータレイクにロードする役割を担います。Fivetran、Airbyte、Stitchなどが代表的なツールです。


結果

10問中何問正解できましたか?

正解数評価
9-10問素晴らしい!Step 2に進みましょう
7-8問良い調子です。間違えた部分を復習しましょう
5-6問基本は理解しています。レッスンを再確認しましょう
4問以下Step 1のレッスンをもう一度丁寧に読み直しましょう

推定所要時間:15分