Step 3 確認クイズ
ハイブリッド推薦システムに関する確認クイズである。5問中4問以上の正解(80%以上)で合格となる。
Q1. ハイブリッド戦略
大規模ECサイト(アイテム数100万以上)で最も適したハイブリッド戦略はどれか?
- A) 加重ハイブリッド(全アイテムのスコアを加重平均)
- B) 切替ハイブリッド(ユーザーの行動数で切替)
- C) カスケードハイブリッド(候補生成→スコアリングの2段階)
- D) すべてのアイテムに対して特徴量結合モデルを適用
正解: C) カスケードハイブリッド(候補生成→スコアリングの2段階)
解説: 100万アイテム全てに対して重いモデルを適用するのは計算量の面で非現実的。カスケードでまず軽量モデル(ANN検索等)で候補を1000件程度に絞り込み、その後に精密なモデルでスコアリングすることで、精度と速度を両立できる。
Q2. LightFMの特徴
LightFMがCold Start問題を緩和できる理由として最も適切なものはどれか?
- A) 学習が高速なため、少ないデータでもすぐに収束する
- B) ユーザーID/アイテムIDに加えてサイド情報のEmbeddingを学習するため
- C) メモリベースの手法であり、全データを保持しているため
- D) ディープラーニングの表現力で少ないデータから汎化できるため
正解: B) ユーザーID/アイテムIDに加えてサイド情報のEmbeddingを学習するため
解説: LightFMはユーザーやアイテムのサイド情報(年齢、カテゴリ、ブランド等)のEmbeddingを学習する。新規ユーザーでもデモグラフィック情報から、新規アイテムでも属性情報からEmbeddingを構成でき、Cold Startを緩和できる。
Q3. 特徴量エンジニアリング
推薦システムの特徴量設計で最も予測力が高いとされる特徴量カテゴリはどれか?
- A) ユーザーの基本属性(年齢、性別)
- B) アイテムの静的属性(カテゴリ、ブランド)
- C) ユーザーの直近の行動パターン(リーセンシー)
- D) コンテキスト情報(時間帯、デバイス)
正解: C) ユーザーの直近の行動パターン(リーセンシー)
解説: 推薦システムにおいて、リーセンシー(直近の行動)は最も予測力が高い特徴量とされる。「1年前に買ったもの」より「昨日見たもの」の方が現在の嗜好を反映している。基本属性(A)は予測力が低く、コンテキスト(D)は補助的な役割。
Q4. リランキングの目的
リランキングで多様性を確保する手法「MMR(Maximal Marginal Relevance)」の基本原理はどれか?
- A) ランダムにアイテムを入れ替えて多様性を確保する
- B) 関連度の高いアイテムを選びつつ、既に選択されたアイテムとの類似度が高いものにペナルティを与える
- C) カテゴリごとに均等にアイテムを割り当てる
- D) 人気度の低いアイテムを優先的に推薦する
正解: B) 関連度の高いアイテムを選びつつ、既に選択されたアイテムとの類似度が高いものにペナルティを与える
解説: MMRは、関連度(Relevance)と多様性(Diversity)のバランスを取る手法。各ステップで「関連度が高く、かつ既に選択されたアイテムとの類似度が低い」アイテムを選択する。ランダム(A)や均等割当(C)は最適ではない。
Q5. ビジネスルール
推薦パイプラインにおけるビジネスルールの適用について、最も適切な設計はどれか?
- A) MLモデルの学習データにビジネスルールを反映させる
- B) 推薦パイプラインの最終段階(リランキング)でビジネスルールを適用する
- C) ビジネスルールのみで推薦し、MLモデルは使わない
- D) ビジネスルールをMLモデルの損失関数に組み込む
正解: B) 推薦パイプラインの最終段階(リランキング)でビジネスルールを適用する
解説: ビジネスルール(在庫フィルタ、利益率考慮、新商品ブースト等)はリランキング段階で適用するのが最も適切。MLモデルは関連度の予測に集中させ、ビジネス制約はポストプロセスで適用することで、関心の分離と柔軟性を確保できる。
結果
- 4問以上正解(80%以上): 合格。Step 4に進もう。
- 3問以下: Step 3のレッスンを復習してから再挑戦しよう。
推定所要時間: 30分