Step 3 確認クイズ

需要予測モデルの構築に関する確認クイズである。5問中4問以上の正解で合格となる。

Q1. SARIMA

SARIMA(1,1,1)(0,1,1,7)の「7」が意味するものとして正しいのはどれか？

正解: C) 季節周期が7（週次）

解説: SARIMA(p,d,q)(P,D,Q,s)のsは季節周期を表す。s=7は日次データにおける週次季節性を意味し、7日前のデータとの関係をモデル化する。

時系列MLにおけるラグ特徴量の作成で、情報漏洩を防ぐために正しい方法はどれか？

正解: B) shift(1)以上で過去のデータのみを使う

解説: 予測時点で利用可能な情報のみを特徴量にする必要がある。shift(0)は当日（まだ観測されていない）、shift(-1)は未来のデータを使うため情報漏洩となる。shift(1)以上で過去の確定したデータのみを使う。

Facebook Prophetの主要な3つの成分として正しい組み合わせはどれか？

正解: B) トレンド、季節性、祝日効果

解説: Prophetは y(t) = g(t) + s(t) + h(t) + ε(t) で構成される。g(t)はトレンド（区分線形またはロジスティック成長）、s(t)は季節性（フーリエ級数）、h(t)は祝日・イベント効果を表す。

LightGBMでtweedie損失関数を使用する理由として最も適切なのはどれか？

正解: B) ゼロ値が多い売上データに適しているため

解説: Store Salesデータでは売上がゼロのレコードが多く存在する（ゼロ膨張データ）。Tweedie分布はゼロを含む非負の連続値をモデル化でき、このようなデータに適した損失関数である。

加重平均アンサンブルの重みを決定する方法として最も適切なのはどれか？

正解: C) バリデーションデータでの性能に基づいて最適化する

解説: 加重平均の重みは、バリデーションデータで目的関数（RMSLE等）を最小化するように最適化する。単純な均等配分よりも高い精度が期待でき、scipy.optimizeのminimize関数などで求められる。

推定所要時間: 30分