チェックポイント - L0 カリキュラム

合格基準

8問中7問以上正解で合格（80%以上）

問題

Q1. 転置インデックスが全文検索で高速な理由は？

A) データを圧縮して保存しているから
B) 単語からドキュメントIDを直接引けるから
C) インメモリで動作するから
D) SQLを使わないから

回答と解説

正解: B

転置インデックスは「単語→ドキュメントIDリスト」のマッピングなので、検索キーワードから該当ドキュメントを直接特定できます。全ドキュメントを走査する必要がありません。

Q2. レコメンデーションの2ステージアーキテクチャで、Stage 1（候補生成）の役割は？

A) 最終的なランキングを決定する
B) 数百万アイテムから数百件程度に高速に絞り込む
C) ユーザーインターフェースに表示する
D) モデルの学習を行う

回答と解説

正解: B

Stage 1（候補生成）は全アイテムから粗い基準で候補を数百件に絞り込みます。Stage 2（ランキング）で精緻なスコアリングを行い最終順位を決定します。

Q3. コールドスタート問題への対処として最も適切なのは？

A) 新規ユーザーにはランダムにアイテムを表示する
B) 全体の人気アイテム表示 → 興味選択 → 段階的パーソナライズ
C) 新規ユーザーが十分なデータを蓄積するまで推薦機能を無効にする
D) 他のサービスからユーザーデータを購入する

回答と解説

正解: B

まずトレンド/人気アイテムを表示し、初回登録時に興味カテゴリを選択させ、行動データの蓄積に応じて段階的にパーソナライズしていくのが効果的です。

Q4. ETLとELTの主な違いは？

A) 使用するプログラミング言語が異なる
B) 変換のタイミングがロード前（ETL）かロード後（ELT）かが異なる
C) データの量に違いがある
D) ETLはクラウド専用、ELTはオンプレミス専用

回答と解説

正解: B

ETLはデータを変換してからウェアハウスにロードします。ELTはまずデータレイクにロードしてからウェアハウス内で変換します。モダンなアプローチではELTが主流です。

Q5. Lambda Architectureでスピードレイヤーの役割は？

A) 全データを高精度にバッチ処理する
B) 新しいデータをリアルタイムで処理し、バッチ結果を補完する
C) データのバックアップを取る
D) クエリの結果をキャッシュする

回答と解説

正解: B

スピードレイヤーは最新のデータをリアルタイムで処理し、バッチレイヤーの結果（やや古い）を補完します。サービングレイヤーで両方をマージして最新かつ正確なデータを提供します。

Q6. OLAPデータベースでスタースキーマが使われる理由は？

A) ストレージを最小化するため
B) トランザクションの安全性を保つため
C) 多次元分析（スライス、ドリルダウン）を効率的に行うため
D) データの正規化を進めるため

回答と解説

正解: C

スタースキーマはファクトテーブルとディメンションテーブルの構造により、多次元分析（地域別、期間別、カテゴリ別の集計等）を効率的にクエリできます。正規化よりもクエリ性能を優先した設計です。

Q7. リアルタイムログ分析で50万行/秒のログを処理する際、最も適切なバッファリングは？

A) RDBMSに直接書き込む
B) Kafka等のメッセージキューでバッファリングする
C) ファイルシステムに直接書き込む
D) メモリにのみ保持する

回答と解説

正解: B

Kafka等のメッセージキューは高スループットの書き込みを受け止め、下流の処理（ストリーム処理、バッチ処理）に適切な速度で配信できます。バックプレッシャーへの対応も可能です。

Q8. 不正検知システムでルールベースとMLモデルを併用する理由は？

A) MLモデルが動作しない場合のバックアップ
B) 明確なパターンはルールで即座にブロックし、曖昧なケースはMLで判定するため
C) ルールベースの方がMLより精度が高いから
D) 法律でルールベースが義務付けられているから

回答と解説

正解: B

盗難カードリストや明確な閾値超過はルールベースで即座にブロック（高速、確実）。パターンが複雑なケースはMLモデルでスコアリング。両方を組み合わせることでカバレッジと精度を両立します。

結果

7問以上正解：合格

Step 4に進みましょう。ミッションクリティカルなシステムのケーススタディに取り組みます。

6問以下：不合格

Step 3の各レッスンを復習してから再挑戦してください。

推定所要時間: 30分