モデル評価と改善クイズ

Step 4 で学んだモデル評価と改善の知識を確認しましょう。

Q1. 交差検証

Stratified K-fold 交差検証の特徴として正しいものはどれですか？

正解: B

解説: Stratified K-fold はクラスの比率を各 Fold で維持する分割方法です。離反率8%のデータなら、各 Fold でも約8%の離反率が保たれます。不均衡データでの評価に特に重要です。

離反予測で閾値を0.5から0.3に下げた場合、一般的にどのような変化が起きますか？

正解: B

解説: 閾値を下げると、より多くのデータを「離反」と予測するため、離反者の見逃し（FN）が減り再現率が上がります。一方で、実際には離反しない顧客も離反と予測される（FP増加）ため、適合率は下がります。

Early Stopping の目的として最も正しいものはどれですか？

正解: B

解説: Early Stopping は、学習の各イテレーションで検証データのスコアを監視し、一定回数（patience）改善が見られなくなったら学習を停止します。これにより、モデルが学習データに過度に適合する前に学習を止められます。

以下のうち、ベイジアン最適化（Optuna等）の特徴として正しいものはどれですか？

正解: C

解説: ベイジアン最適化は、過去の試行結果から目的関数の分布を推定し、次に試すべきパラメータを賢く選択します。GridSearch（網羅的）やRandomSearch（ランダム）より効率的にパラメータ空間を探索でき、少ない試行回数で良い結果が得られます。

以下のモデルの評価結果に対して、最も効果的な対策はどれですか？

学習F1: 0.95, 検証F1: 0.70（ギャップ: 0.25）
特徴量数: 50, データ数: 500

正解: B

解説: 学習と検証のギャップが0.25と非常に大きく、重度の過学習です。データ数500に対して特徴量50は多すぎるため、特徴量を削減し、正則化を強化してモデルの複雑度を下げるべきです。n_estimators増加や学習率増加は過学習を悪化させ、閾値調整は過学習の根本的な解決にはなりません。

5問中の正解数を確認してください。

推定所要時間: 30分