合格基準
- 8問中7問以上正解で合格(80%以上)
問題
Q1. 転置インデックスが全文検索で高速な理由は?
- A) データを圧縮して保存しているから
- B) 単語からドキュメントIDを直接引けるから
- C) インメモリで動作するから
- D) SQLを使わないから
回答と解説
正解: B
転置インデックスは「単語→ドキュメントIDリスト」のマッピングなので、検索キーワードから該当ドキュメントを直接特定できます。全ドキュメントを走査する必要がありません。
Q2. レコメンデーションの2ステージアーキテクチャで、Stage 1(候補生成)の役割は?
- A) 最終的なランキングを決定する
- B) 数百万アイテムから数百件程度に高速に絞り込む
- C) ユーザーインターフェースに表示する
- D) モデルの学習を行う
回答と解説
正解: B
Stage 1(候補生成)は全アイテムから粗い基準で候補を数百件に絞り込みます。Stage 2(ランキング)で精緻なスコアリングを行い最終順位を決定します。
Q3. コールドスタート問題への対処として最も適切なのは?
- A) 新規ユーザーにはランダムにアイテムを表示する
- B) 全体の人気アイテム表示 → 興味選択 → 段階的パーソナライズ
- C) 新規ユーザーが十分なデータを蓄積するまで推薦機能を無効にする
- D) 他のサービスからユーザーデータを購入する
回答と解説
正解: B
まずトレンド/人気アイテムを表示し、初回登録時に興味カテゴリを選択させ、行動データの蓄積に応じて段階的にパーソナライズしていくのが効果的です。
Q4. ETLとELTの主な違いは?
- A) 使用するプログラミング言語が異なる
- B) 変換のタイミングがロード前(ETL)かロード後(ELT)かが異なる
- C) データの量に違いがある
- D) ETLはクラウド専用、ELTはオンプレミス専用
回答と解説
正解: B
ETLはデータを変換してからウェアハウスにロードします。ELTはまずデータレイクにロードしてからウェアハウス内で変換します。モダンなアプローチではELTが主流です。
Q5. Lambda Architectureでスピードレイヤーの役割は?
- A) 全データを高精度にバッチ処理する
- B) 新しいデータをリアルタイムで処理し、バッチ結果を補完する
- C) データのバックアップを取る
- D) クエリの結果をキャッシュする
回答と解説
正解: B
スピードレイヤーは最新のデータをリアルタイムで処理し、バッチレイヤーの結果(やや古い)を補完します。サービングレイヤーで両方をマージして最新かつ正確なデータを提供します。
Q6. OLAPデータベースでスタースキーマが使われる理由は?
- A) ストレージを最小化するため
- B) トランザクションの安全性を保つため
- C) 多次元分析(スライス、ドリルダウン)を効率的に行うため
- D) データの正規化を進めるため
回答と解説
正解: C
スタースキーマはファクトテーブルとディメンションテーブルの構造により、多次元分析(地域別、期間別、カテゴリ別の集計等)を効率的にクエリできます。正規化よりもクエリ性能を優先した設計です。
Q7. リアルタイムログ分析で50万行/秒のログを処理する際、最も適切なバッファリングは?
- A) RDBMSに直接書き込む
- B) Kafka等のメッセージキューでバッファリングする
- C) ファイルシステムに直接書き込む
- D) メモリにのみ保持する
回答と解説
正解: B
Kafka等のメッセージキューは高スループットの書き込みを受け止め、下流の処理(ストリーム処理、バッチ処理)に適切な速度で配信できます。バックプレッシャーへの対応も可能です。
Q8. 不正検知システムでルールベースとMLモデルを併用する理由は?
- A) MLモデルが動作しない場合のバックアップ
- B) 明確なパターンはルールで即座にブロックし、曖昧なケースはMLで判定するため
- C) ルールベースの方がMLより精度が高いから
- D) 法律でルールベースが義務付けられているから
回答と解説
正解: B
盗難カードリストや明確な閾値超過はルールベースで即座にブロック(高速、確実)。パターンが複雑なケースはMLモデルでスコアリング。両方を組み合わせることでカバレッジと精度を両立します。
結果
7問以上正解:合格
Step 4に進みましょう。ミッションクリティカルなシステムのケーススタディに取り組みます。
6問以下:不合格
Step 3の各レッスンを復習してから再挑戦してください。
推定所要時間: 30分