クイズの説明
Step 1「データ戦略とアーキテクチャを理解しよう」の理解度を確認します。データ戦略、アーキテクチャパターン、Data Mesh、Medallionアーキテクチャについて問います。
合格ライン: 80%(5問中4問正解)
問題
Q1. データ戦略の基本
データ戦略を策定する際に、最初に行うべきことはどれですか?
- A. BigQueryやSnowflakeなどのDWH製品を比較検討する
- B. ビジネス目標を明確にし、データで実現すべきことを定義する
- C. データエンジニアを採用する
- D. 全社のデータをデータレイクに集約する
答えを見る
正解: B
データ戦略はビジネス戦略をデータで実現するための計画です。最初にビジネス目標(例: 売上20%成長、解約率3%以下)を明確にし、そこから逆算して必要なデータ基盤を定義します。ツール選定(A)や人材採用(C)、データ集約(D)はビジネス目標が明確になった後のステップです。「BigQueryを導入しよう」から始めると、ツールを入れただけで誰も使わないデータ基盤ができあがるリスクがあります。
Q2. ETL vs ELT
モダンデータスタックでETL(Extract-Transform-Load)よりもELT(Extract-Load-Transform)が主流になっている最大の理由はどれですか?
- A. ELTの方がETLよりも安価だから
- B. ELTではデータの変換が不要になるから
- C. 生データをDWHにロードした後に変換するため、ビジネス要件の変化に柔軟に対応でき、DWHのスケーラビリティを活用できるから
- D. ELTではリアルタイム処理が可能になるから
答えを見る
正解: C
ELTの最大のメリットは柔軟性とスケーラビリティです。生データをDWH(BigQuery、Snowflake等)にそのままロードし、DWHの豊富なコンピュートリソースで変換を行います。ETLではステージングサーバーで変換してからロードするため、変換済みデータしか残りません。ELTでは生データが残るため、ビジネス要件が変わっても新しいモデルを再構築できます。変換が不要になるわけではなく(B)、dbt等のツールで変換を管理します。
Q3. Data Meshの原則
Data Meshにおいて「データをプロダクトとして扱う」原則が意味することとして、最も適切なものはどれですか?
- A. データを外部に販売してマネタイズすること
- B. データに発見可能性、信頼性、SLA等のプロダクト属性を持たせ、消費者にとって使いやすい形で提供すること
- C. データの管理を専門のプロダクトチームに集約すること
- D. データをすべてAPI化して提供すること
答えを見る
正解: B
Data Meshにおける「データプロダクト」とは、データに発見可能性(カタログ登録)、理解しやすさ(ドキュメント)、信頼性(SLA)、セキュリティ(アクセスポリシー)、相互運用性(標準フォーマット)といったプロダクト属性を持たせることを意味します。データの消費者がセルフサービスで見つけ、信頼して使えるようにすることが目的です。外部販売(A)や集約(C)、API化(D)とは異なります。
Q4. Medallionアーキテクチャ
Medallionアーキテクチャにおいて、Bronze層の設計原則として正しいものはどれですか?
- A. ビジネスロジックを適用し、KPIが計算された状態で保存する
- B. ソースデータを忠実に保存し、追記のみ(Append-only)で、既存データを更新しない
- C. 重複排除とNULL処理を行い、正規化された状態で保存する
- D. 消費者が直接クエリできるように集計済みの状態で保存する
答えを見る
正解: B
Bronze層の設計原則は「ソースデータの忠実な保存」です。追記のみ(Append-only)で既存データを更新せず、取り込み日時やソース名などのメタデータを付与します。これにより、後から変換ロジックを変更したい場合でも生データから再処理できます。重複排除・正規化(C)はSilver層、ビジネスロジック適用(A)・集計(D)はGold層の責務です。
Q5. アーキテクチャ選定
以下の条件の組織に最適なアーキテクチャパターンの組み合わせはどれですか?
エンジニア30名、単一プロダクト、データチーム3名、現在のデータ成熟度L1。リアルタイム性は日次で十分。
- A. Data Mesh + Lambda Architecture + ETL
- B. 中央集権型データチーム + Medallionアーキテクチャ + ELT
- C. Kappa Architecture + Data Mesh + ストリーム処理のみ
- D. 分散型データチーム + ETL + オンプレミスDWH
答えを見る
正解: B
エンジニア30名・単一プロダクトの組織ではData Meshは時期尚早です(A, C)。ドメイン分割が不明確で、各チームにデータスキルを持たせる余裕がありません。成熟度L1なので、まず中央集権型のデータチームでMedallionアーキテクチャ(Bronze/Silver/Gold)を構築し、ELTでBigQuery等のスケーラビリティを活用するのが最適です。リアルタイム性が日次で十分なため、Kappa Architecture(C)やLambda Architecture(A)は不要です。
結果
合格(4問以上正解)
Step 1の内容をよく理解しています。データ戦略の策定方法、アーキテクチャパターンの使い分け、Data MeshとMedallionアーキテクチャの基本概念を身につけました。次のStep 2「データレイクとウェアハウスを設計しよう」に進みましょう。
不合格(3問以下正解)
Step 1の内容を復習しましょう。特に以下のポイントを重点的に確認してください:
- データ戦略 — ビジネス目標から逆算したデータ基盤の設計
- ETL vs ELT — モダンデータスタックでELTが主流になった理由
- Data Mesh — 4つの原則と導入判断基準
- Medallion — Bronze/Silver/Goldの3層の責務の違い
推定所要時間: 15分