Step 3 確認クイズ

テキスト分類モデル構築に関する確認クイズである。5問中4問以上の正解で合格となる。

Q1. Naive Bayes

Naive Bayesの「ナイーブ」が意味する仮定はどれか？

正解: B) 特徴量が互いに独立である

解説: Naive BayesはP(x1,x2,…|C) = P(x1|C)P(x2|C)…と仮定する。実際のテキストでは単語間に依存関係があるが、この素朴（ナイーブ）な仮定でも実用的な精度が得られる。

BERT Fine-tuningで学習率を1e-3に設定した場合に起こりうる問題はどれか？

正解: B) 事前学習で獲得した知識が破壊される（catastrophic forgetting）

解説: 1e-3はFine-tuningには大きすぎる学習率であり、事前学習で獲得した言語知識が急速に上書きされてしまう。推奨は2e-5〜5e-5程度の小さな学習率で、事前学習の知識を保持しつつタスクに適応させる。

LLM Zero-shotが従来MLより優れている条件はどれか？

正解: B) 学習データがほぼなく、素早くPoCを実施したい場合

解説: LLM Zero-shotの最大の利点は学習データなしで分類が可能な点。プロンプトを用意するだけでPoCを即座に開始できる。一方、コストとレイテンシでは従来MLに劣る。

月5,000件の問い合わせを分類するシステムで、学習データ3,000件あり、レイテンシ要件が50ms以内の場合、最適な手法はどれか？

正解: B) BERT Fine-tuning

解説: 学習データ3,000件は十分、50msのレイテンシはBERTで対応可能（約10ms）、月5,000件ならAPI費用は不要。精度と運用コストのバランスでBERT Fine-tuningが最適。

テキスト分類システムの段階的移行戦略として最も適切な順序はどれか？

正解: B) LLM Zero-shot → BERT Fine-tuning → SVMフォールバック

解説: まずLLM Zero-shotでデータなしにPoCを実施しつつラベルデータを収集、データが溜まったらBERT Fine-tuningに移行して精度とコストを最適化、SVMをフォールバックとして併用する段階的アプローチが現実的。

推定所要時間: 30分