実践テクニッククイズ

Step 5 で学んだ深層学習の実践テクニックの知識を確認しましょう。5問中4問以上の正解で合格です。

Q1. Dropout

Dropout について正しい記述はどれですか？

正解: B

解説: Dropout は学習時のみランダムにニューロンを無効化します。推論時は全ニューロンを使用し、学習時にスケーリングされた出力（inverted dropout）をそのまま使います。model.eval() で自動的に切り替わります。

Transformer で LayerNorm が BatchNorm より好まれる理由はどれですか？

正解: B

解説: BatchNorm はバッチ方向に正規化するため、小さいバッチサイズでは統計量が不安定になります。LayerNorm は各サンプル内の特徴量方向に正規化するため、バッチサイズに依存せず、可変長のテキスト系列にも自然に適用できます。

Warmup を使う主な理由はどれですか？

正解: B

解説: 学習開始時のランダムな重みに対して大きな学習率を適用すると、パラメータが不安定に振動する可能性があります。Warmup で最初は小さい学習率から始め、徐々に本来の学習率に引き上げることで、安定した学習を実現します。

以下のコードの問題点はどれですか？

model.eval()
outputs = model(test_data)
loss = criterion(outputs, test_labels)
loss.backward()
test_accuracy = compute_accuracy(outputs, test_labels)

正解: B

解説: テスト時は勾配計算が不要です。loss.backward() を実行すると不要な勾配が計算され、メモリが浪費されます。テスト時は with torch.no_grad(): で勾配計算を無効化し、loss.backward() を呼ばないようにすべきです。

Mixed Precision Training の主な利点はどれですか？

正解: B

解説: Mixed Precision Training は FP32 と FP16 を適切に混合することで、メモリ使用量を約50%削減し、GPU の Tensor Core を活用して学習速度を1.5-3倍に向上させます。精度はほぼ同等に維持されます。

5問中の正解数を確認してください。

推定所要時間: 15分