QUIZ 15分

クイズの説明

Step 1「データ戦略とアーキテクチャを理解しよう」の理解度を確認します。データ戦略、アーキテクチャパターン、Data Mesh、Medallionアーキテクチャについて問います。

合格ライン: 80%(5問中4問正解)


問題

Q1. データ戦略の基本

データ戦略を策定する際に、最初に行うべきことはどれですか?

  • A. BigQueryやSnowflakeなどのDWH製品を比較検討する
  • B. ビジネス目標を明確にし、データで実現すべきことを定義する
  • C. データエンジニアを採用する
  • D. 全社のデータをデータレイクに集約する
答えを見る

正解: B

データ戦略はビジネス戦略をデータで実現するための計画です。最初にビジネス目標(例: 売上20%成長、解約率3%以下)を明確にし、そこから逆算して必要なデータ基盤を定義します。ツール選定(A)や人材採用(C)、データ集約(D)はビジネス目標が明確になった後のステップです。「BigQueryを導入しよう」から始めると、ツールを入れただけで誰も使わないデータ基盤ができあがるリスクがあります。


Q2. ETL vs ELT

モダンデータスタックでETL(Extract-Transform-Load)よりもELT(Extract-Load-Transform)が主流になっている最大の理由はどれですか?

  • A. ELTの方がETLよりも安価だから
  • B. ELTではデータの変換が不要になるから
  • C. 生データをDWHにロードした後に変換するため、ビジネス要件の変化に柔軟に対応でき、DWHのスケーラビリティを活用できるから
  • D. ELTではリアルタイム処理が可能になるから
答えを見る

正解: C

ELTの最大のメリットは柔軟性とスケーラビリティです。生データをDWH(BigQuery、Snowflake等)にそのままロードし、DWHの豊富なコンピュートリソースで変換を行います。ETLではステージングサーバーで変換してからロードするため、変換済みデータしか残りません。ELTでは生データが残るため、ビジネス要件が変わっても新しいモデルを再構築できます。変換が不要になるわけではなく(B)、dbt等のツールで変換を管理します。


Q3. Data Meshの原則

Data Meshにおいて「データをプロダクトとして扱う」原則が意味することとして、最も適切なものはどれですか?

  • A. データを外部に販売してマネタイズすること
  • B. データに発見可能性、信頼性、SLA等のプロダクト属性を持たせ、消費者にとって使いやすい形で提供すること
  • C. データの管理を専門のプロダクトチームに集約すること
  • D. データをすべてAPI化して提供すること
答えを見る

正解: B

Data Meshにおける「データプロダクト」とは、データに発見可能性(カタログ登録)、理解しやすさ(ドキュメント)、信頼性(SLA)、セキュリティ(アクセスポリシー)、相互運用性(標準フォーマット)といったプロダクト属性を持たせることを意味します。データの消費者がセルフサービスで見つけ、信頼して使えるようにすることが目的です。外部販売(A)や集約(C)、API化(D)とは異なります。


Q4. Medallionアーキテクチャ

Medallionアーキテクチャにおいて、Bronze層の設計原則として正しいものはどれですか?

  • A. ビジネスロジックを適用し、KPIが計算された状態で保存する
  • B. ソースデータを忠実に保存し、追記のみ(Append-only)で、既存データを更新しない
  • C. 重複排除とNULL処理を行い、正規化された状態で保存する
  • D. 消費者が直接クエリできるように集計済みの状態で保存する
答えを見る

正解: B

Bronze層の設計原則は「ソースデータの忠実な保存」です。追記のみ(Append-only)で既存データを更新せず、取り込み日時やソース名などのメタデータを付与します。これにより、後から変換ロジックを変更したい場合でも生データから再処理できます。重複排除・正規化(C)はSilver層、ビジネスロジック適用(A)・集計(D)はGold層の責務です。


Q5. アーキテクチャ選定

以下の条件の組織に最適なアーキテクチャパターンの組み合わせはどれですか?

エンジニア30名、単一プロダクト、データチーム3名、現在のデータ成熟度L1。リアルタイム性は日次で十分。

  • A. Data Mesh + Lambda Architecture + ETL
  • B. 中央集権型データチーム + Medallionアーキテクチャ + ELT
  • C. Kappa Architecture + Data Mesh + ストリーム処理のみ
  • D. 分散型データチーム + ETL + オンプレミスDWH
答えを見る

正解: B

エンジニア30名・単一プロダクトの組織ではData Meshは時期尚早です(A, C)。ドメイン分割が不明確で、各チームにデータスキルを持たせる余裕がありません。成熟度L1なので、まず中央集権型のデータチームでMedallionアーキテクチャ(Bronze/Silver/Gold)を構築し、ELTでBigQuery等のスケーラビリティを活用するのが最適です。リアルタイム性が日次で十分なため、Kappa Architecture(C)やLambda Architecture(A)は不要です。


結果

合格(4問以上正解)

Step 1の内容をよく理解しています。データ戦略の策定方法、アーキテクチャパターンの使い分け、Data MeshとMedallionアーキテクチャの基本概念を身につけました。次のStep 2「データレイクとウェアハウスを設計しよう」に進みましょう。

不合格(3問以下正解)

Step 1の内容を復習しましょう。特に以下のポイントを重点的に確認してください:

  • データ戦略 — ビジネス目標から逆算したデータ基盤の設計
  • ETL vs ELT — モダンデータスタックでELTが主流になった理由
  • Data Mesh — 4つの原則と導入判断基準
  • Medallion — Bronze/Silver/Goldの3層の責務の違い

推定所要時間: 15分