卒業クイズ - L0 カリキュラム

クイズの説明

Month 6「本番AIシステムを運用しよう」の全範囲から出題される卒業クイズです。

全10問
合格ライン: 80%（8問正解）
不合格の場合は該当Stepを復習してから再挑戦してください

問題

Q1. LLMOpsパイプラインにおいて、従来のMLOpsと最も大きく異なる点はどれですか？

A) データ収集の方法
B) プロンプト管理とバージョニングが中心的な役割を果たすこと
C) デプロイの自動化方法
D) テストの種類

答えを見る

正解: B

従来のMLOpsではモデルの学習・再学習が中心ですが、LLMOpsでは事前学習済みのモデルを使用するため、プロンプトの設計・管理・バージョニングが品質を左右する中心的な要素になります。プロンプトの変更がモデルの挙動を大きく変えるため、体系的な管理が不可欠です。

Q2. API Gatewayでのフォールバック戦略において、プライマリのOpenAI APIがダウンした場合の適切な対応はどれですか？

A) エラーをユーザーに返す
B) 代替プロバイダー（Anthropic等）に自動切替し、品質が異なることを考慮しつつサービスを継続する
C) 全ての処理をキューに入れて復旧を待つ
D) サーバーを再起動する

答えを見る

正解: B

マルチプロバイダーフォールバックは、特定のAPIプロバイダーに依存しない高可用性を実現する重要な戦略です。OpenAIがダウンした場合、Anthropic等の代替プロバイダーに自動切替することでサービスを継続します。ただし、モデル間で出力の傾向が異なるため、品質監視と対応が必要です。

Q3. プロンプトログ収集において、個人情報を含む可能性のあるデータを「ハッシュ化して記録」する理由は何ですか？

A) 検索を高速化するため
B) データの同一性を検証できつつ、ログ自体からの個人情報漏洩リスクを低減するため
C) ストレージコストを削減するため
D) データを圧縮するため

答えを見る

正解: B

ハッシュ化によりログに個人情報そのものを記録せずに済み、ログの漏洩時にも個人情報が露出しません。一方で、ハッシュ値により「同じ入力が再度来たか」の同一性検証は可能であり、監査やデバッグに必要なトレーサビリティを確保できます。

Q4. データドリフトとコンセプトドリフトの両方が同時に発生した場合、最初に確認すべきことは何ですか？

A) モデルを即座に再学習する
B) 入力データの分布変化を分析し、どのような変化が起きているかを特定する
C) アラートを無効にする
D) 全てのリクエストをリジェクトする

答えを見る

正解: B

ドリフトの対処には根本原因の特定が先決です。まず入力データの分布変化（新しいカテゴリの出現、季節変動等）を分析し、それがコンセプトドリフト（ユーザーの嗜好変化等）とどう関連しているかを理解します。原因を特定せずにモデルを再学習しても、適切な改善にはなりません。

Q5. アラート設計で「連続3回超過」の条件を設ける最大の目的は何ですか？

A) アラートの送信回数を減らすため
B) 一時的なスパイクによる偽陽性を排除し、真の異常のみを通知するため
C) サーバー負荷を軽減するため
D) アラートの優先度を上げるため

答えを見る

正解: B

一時的なネットワーク遅延やバースト的な負荷で一瞬閾値を超えることはよくあります。毎回アラートが発報されるとアラート疲れが起き、本当の異常も見逃されます。連続N回の条件により一時的な変動を除外し、持続的な問題のみを通知することが目的です。

Q6. LLMシステムのコスト構造で最も大きな割合を占めるAPIトークン費用を削減する最も効果的な施策はどれですか？

A) サーバーのスペックをダウングレードする
B) タスク複雑度に応じたモデルルーティングとセマンティックキャッシュの組み合わせ
C) ログの保存期間を短くする
D) 開発者の人数を減らす

答えを見る

正解: B

APIトークン費用（60-80%）の削減には、モデルルーティング（簡単なタスクを安価なモデルで処理、50-70%削減）とセマンティックキャッシュ（類似リクエストのキャッシュ返却、20-40%削減）の組み合わせが最も効果的です。品質を維持しながら大幅なコスト削減を実現できます。

Q7. カスケードパターンでGPT-4o-miniで処理後にGPT-4oにエスカレーションする判断基準は何ですか？

A) リクエストの到着順
B) GPT-4o-miniの出力の品質スコアが閾値を下回った場合
C) ランダムに選択
D) ユーザーが手動で選択

答えを見る

正解: B

カスケードパターンでは、低コストモデル（GPT-4o-mini）の出力に対して自動品質評価を行い、品質スコアが事前設定の閾値（例: 0.8）を下回った場合にのみ高性能モデル（GPT-4o）で再処理します。大半のリクエストが低コストモデルで十分な品質を達成するため、品質維持とコスト削減を両立できます。

Q8. A/Bテストで「統計的有意差なし」の結果が出た場合の適切な対応はどれですか？

A) Treatmentを強制的に採用する
B) サンプルサイズが十分であればTreatmentを棄却し、不十分であればテストを延長する
C) テストを中止して元に戻す
D) テスト設計を変更して再実施する

答えを見る

正解: B

統計的有意差なしの場合、2つの可能性があります。サンプルサイズが十分（事前計算した必要数以上）であれば、Treatmentに実質的な効果がないと判断して棄却します。サンプルサイズが不十分であれば、効果が小さい可能性があるためテスト期間を延長してデータを追加収集します。

Q9. フィードバックループで「暗黙的フィードバック」が「明示的フィードバック」より重要視される場面はどれですか？

A) 品質の厳密な測定が必要な場合
B) フィードバック回答率が低く、全ユーザーの行動データから品質シグナルを得たい場合
C) ユーザーの意見を直接収集したい場合
D) 法規制対応が必要な場合

答えを見る

正解: B

明示的フィードバック（Good/Badボタン等）の回答率は通常10-20%であり、サンプルに偏りがあります。暗黙的フィードバック（再質問、エスカレーション、離脱等）は全ユーザーから自動的に収集できるため、より代表的な品質シグナルを大量に得ることができます。

Q10. LLMOpsの成熟度を「Level 1（場当たり的）」から「Level 4（最適化）」に引き上げるために最も重要な投資は何ですか？

A) 最新のGPUサーバーの導入
B) モニタリング基盤、CI/CDパイプライン、コスト管理体制、データ駆動の改善サイクルの構築
C) AIモデルの自社開発
D) 社員全員へのAI研修

答えを見る

正解: B

Level 4（最適化）は、AIシステムの運用が自動化され、データに基づいて継続的に改善されている状態です。これを実現するには、可観測性のあるモニタリング基盤、安全なデプロイのCI/CDパイプライン、FinOpsによるコスト管理体制、A/Bテストとフィードバックループによるデータ駆動の改善サイクルが不可欠です。

結果

8問以上正解の場合

合格です。Month 6「本番AIシステムを運用しよう」を修了しました。 LLMOpsの全体像、サービング基盤、モニタリング、コスト最適化、継続的改善サイクルの設計力が身につきました。

AI Track Month 4〜6の全カリキュラムを完了しました。おめでとうございます。

7問以下の場合

もう少し復習しましょう。

問題	復習セクション
Q1	Step 1: LLMOps入門
Q2	Step 2: モデルデプロイとサービング基盤
Q3	Step 3: プロンプトログ収集
Q4	Step 3: ドリフト検出
Q5	Step 3: アラートとダッシュボード
Q6	Step 4: コスト最適化戦略
Q7	Step 4: モデル選択最適化
Q8	Step 5: A/Bテスト
Q9	Step 5: フィードバックループ
Q10	Step 6: 総合演習

推定所要時間: 30分