QUIZ 30分

クイズの説明

Month 6「データアーキテクチャを設計しよう」の総合理解度を確認します。全10問、80%(8問)以上正解で合格です。


問題

Q1. 第3正規形(3NF)の主な利点はどれですか?

  • A) クエリ性能が最も高い
  • B) データの冗長性を排除し、更新時の整合性を保つ
  • C) ストレージ容量が最小になる
  • D) インデックスが不要になる
答えを見る

正解: B

3NFはデータの冗長性を排除することで、更新・削除時のアノマリー(異常)を防ぎ、データの整合性を保ちます。


Q2. NoSQLデータモデリングの基本原則はどれですか?

  • A) まず正規化し、必要に応じて非正規化する
  • B) アクセスパターンに基づいてデータを設計する
  • C) テーブル数を最小にする
  • D) リレーションシップを重視する
答えを見る

正解: B

NoSQLでは「どのようにデータにアクセスするか」(クエリパターン)を起点にデータモデルを設計します。RDBのように正規化から始めるのではなく、読み取り最適化を優先します。


Q3. Lambda Architectureの特徴はどれですか?

  • A) サーバーレスのみで構築するアーキテクチャ
  • B) バッチ処理層とスピード処理層を組み合わせる
  • C) 単一のストリーム処理のみで構築する
  • D) データを永続化しないアーキテクチャ
答えを見る

正解: B

Lambda Architectureはバッチ層(正確だが遅い)とスピード層(リアルタイムだが近似的)を組み合わせ、両方の結果をサービング層で統合するアーキテクチャです。


Q4. Data Meshの4つの原則に含まれないものはどれですか?

  • A) ドメインオーナーシップ
  • B) データをプロダクトとして扱う
  • C) 中央集権的なデータチーム
  • D) セルフサービスデータプラットフォーム
答えを見る

正解: C

Data Meshの4原則は、ドメインオーナーシップ、データをプロダクトとして扱う、セルフサービスプラットフォーム、フェデレーテッドガバナンスです。中央集権的なデータチームとは逆の分散型アプローチです。


Q5. Star SchemaとSnowflake Schemaの違いはどれですか?

  • A) Star Schemaの方がクエリが遅い
  • B) Snowflake Schemaはディメンションテーブルがさらに正規化されている
  • C) Star SchemaはNoSQL専用
  • D) 両者に違いはない
答えを見る

正解: B

Star Schemaはファクトテーブルを中心にディメンションテーブルが非正規化された形で配置されます。Snowflake Schemaはディメンションがさらに正規化(分解)されている点が異なります。


Q6. ETLとELTの主な違いはどれですか?

  • A) 使用するプログラミング言語が異なる
  • B) ETLは変換後にロード、ELTはロード後に変換する
  • C) ETLの方が常に高速
  • D) ELTはバッチ処理専用
答えを見る

正解: B

ETL(Extract-Transform-Load)はデータを変換してからDWHにロードし、ELT(Extract-Load-Transform)はまずDWHにロードしてからDWHの処理能力で変換します。クラウドDWHの台頭でELTが主流になっています。


Q7. データレイクハウスの利点はどれですか?

  • A) データレイクの柔軟性とDWHのパフォーマンス・ガバナンスを兼ね備える
  • B) ストレージコストが最も安い
  • C) SQLが使えない
  • D) 構造化データのみ扱える
答えを見る

正解: A

レイクハウスはデータレイク(低コスト、スキーマオンリード)とDWH(ACID、高速クエリ)の利点を組み合わせたアーキテクチャです。Delta Lake、Apache Icebergが代表例です。


Q8. CDCの代表的な実装方式はどれですか?

  • A) 定期的なフルテーブルスキャン
  • B) データベースのWAL(Write-Ahead Log)を読み取る
  • C) アプリケーションコードに変更通知を埋め込む
  • D) データベースをリスタートする
答えを見る

正解: B

CDCの最も効率的な実装は、データベースのWAL(PostgreSQL)やBinlog(MySQL)を読み取ってリアルタイムに変更をキャプチャする方式です。Debeziumがこの方式を採用しています。


Q9. データ品質の次元に含まれるものはどれですか?

  • A) 完全性、正確性、適時性、一貫性
  • B) 速度、容量、多様性
  • C) 機密性、完全性、可用性
  • D) 計画、実行、監視、改善
答えを見る

正解: A

データ品質の主な次元は、完全性(欠損がない)、正確性(値が正しい)、適時性(最新である)、一貫性(矛盾がない)、一意性(重複がない)、有効性(形式が正しい)です。


Q10. フェデレーテッドガバナンスの意味はどれですか?

  • A) 中央チームが全てのガバナンスルールを策定・実施する
  • B) 全体的なポリシーは中央で定義し、実施は各ドメインチームが自律的に行う
  • C) ガバナンスを外部ベンダーに委託する
  • D) ガバナンスルールを設けない
答えを見る

正解: B

フェデレーテッドガバナンスは、グローバルなポリシーやスタンダードを中央で定義しつつ、その実施と運用は各ドメインチームが自律的に行う分散型ガバナンスモデルです。


結果

8問以上正解の場合

合格です。 Month 7「パフォーマンスエンジニアリング」に進みましょう。

7問以下の場合

もう少し復習しましょう。 データモデリング、パイプライン、分析基盤、ガバナンス、移行を復習してください。