機械学習の基礎クイズ

Step 1 で学んだ機械学習の基礎知識を確認しましょう。5問中4問以上の正解で合格です。

Q1. 機械学習と従来プログラミングの違い

従来のプログラミングと機械学習の違いとして、最も適切なものはどれですか？

正解: B

解説: 従来のプログラミングでは「ルール + データ → 結果」という流れですが、機械学習では「データ + 結果 → ルール（モデル）」という逆の流れでパターンを学習します。

NetShop の「顧客が離反するかしないかを予測する」タスクは、以下のどれに分類されますか？

正解: C

解説: 離反する（1）/しない（0）という2つのカテゴリを予測する問題なので、教師あり学習の二値分類に該当します。正解ラベル（過去の離反実績）があるため教師あり学習です。

テストデータを学習データとは別に確保する主な理由はどれですか？

正解: B

解説: テストデータは、モデルが「まだ見たことがないデータ」に対してどれだけ正確に予測できるかという汎化性能を評価するために使います。学習データで評価すると、暗記による見かけ上の高精度を検出できません。

以下のモデル評価結果のうち、過学習が疑われるのはどれですか？

正解: C

解説: 学習データで99%と極端に高い精度を出しているにもかかわらず、テストデータでは65%に大きく低下しています。これはモデルが学習データのパターン（ノイズ含む）を暗記してしまい、新しいデータへの汎化ができていない過学習の典型的な兆候です。

離反率 5% のデータで「全員離反しない」と予測した場合、正解率は 95% になります。この問題を適切に評価するために最も重要な指標はどれですか？

正解: B

解説: 不均衡データでは正解率は誤解を招きます。離反予測では「離反者を見逃さない」ことが重要なため、再現率（実際の離反者のうち正しく予測できた割合）が重要な指標です。F1スコアと合わせて評価するのが望ましいです。

5問中の正解数を確認してください。

推定所要時間: 15分