QUIZ 30分

クイズの説明

Month 6「本番AIシステムを運用しよう」の全範囲から出題される卒業クイズです。

  • 全10問
  • 合格ライン: 80%(8問正解)
  • 不合格の場合は該当Stepを復習してから再挑戦してください

問題

Q1. LLMOpsパイプラインにおいて、従来のMLOpsと最も大きく異なる点はどれですか?

  • A) データ収集の方法
  • B) プロンプト管理とバージョニングが中心的な役割を果たすこと
  • C) デプロイの自動化方法
  • D) テストの種類
答えを見る

正解: B

従来のMLOpsではモデルの学習・再学習が中心ですが、LLMOpsでは事前学習済みのモデルを使用するため、プロンプトの設計・管理・バージョニングが品質を左右する中心的な要素になります。プロンプトの変更がモデルの挙動を大きく変えるため、体系的な管理が不可欠です。


Q2. API Gatewayでのフォールバック戦略において、プライマリのOpenAI APIがダウンした場合の適切な対応はどれですか?

  • A) エラーをユーザーに返す
  • B) 代替プロバイダー(Anthropic等)に自動切替し、品質が異なることを考慮しつつサービスを継続する
  • C) 全ての処理をキューに入れて復旧を待つ
  • D) サーバーを再起動する
答えを見る

正解: B

マルチプロバイダーフォールバックは、特定のAPIプロバイダーに依存しない高可用性を実現する重要な戦略です。OpenAIがダウンした場合、Anthropic等の代替プロバイダーに自動切替することでサービスを継続します。ただし、モデル間で出力の傾向が異なるため、品質監視と対応が必要です。


Q3. プロンプトログ収集において、個人情報を含む可能性のあるデータを「ハッシュ化して記録」する理由は何ですか?

  • A) 検索を高速化するため
  • B) データの同一性を検証できつつ、ログ自体からの個人情報漏洩リスクを低減するため
  • C) ストレージコストを削減するため
  • D) データを圧縮するため
答えを見る

正解: B

ハッシュ化によりログに個人情報そのものを記録せずに済み、ログの漏洩時にも個人情報が露出しません。一方で、ハッシュ値により「同じ入力が再度来たか」の同一性検証は可能であり、監査やデバッグに必要なトレーサビリティを確保できます。


Q4. データドリフトとコンセプトドリフトの両方が同時に発生した場合、最初に確認すべきことは何ですか?

  • A) モデルを即座に再学習する
  • B) 入力データの分布変化を分析し、どのような変化が起きているかを特定する
  • C) アラートを無効にする
  • D) 全てのリクエストをリジェクトする
答えを見る

正解: B

ドリフトの対処には根本原因の特定が先決です。まず入力データの分布変化(新しいカテゴリの出現、季節変動等)を分析し、それがコンセプトドリフト(ユーザーの嗜好変化等)とどう関連しているかを理解します。原因を特定せずにモデルを再学習しても、適切な改善にはなりません。


Q5. アラート設計で「連続3回超過」の条件を設ける最大の目的は何ですか?

  • A) アラートの送信回数を減らすため
  • B) 一時的なスパイクによる偽陽性を排除し、真の異常のみを通知するため
  • C) サーバー負荷を軽減するため
  • D) アラートの優先度を上げるため
答えを見る

正解: B

一時的なネットワーク遅延やバースト的な負荷で一瞬閾値を超えることはよくあります。毎回アラートが発報されるとアラート疲れが起き、本当の異常も見逃されます。連続N回の条件により一時的な変動を除外し、持続的な問題のみを通知することが目的です。


Q6. LLMシステムのコスト構造で最も大きな割合を占めるAPIトークン費用を削減する最も効果的な施策はどれですか?

  • A) サーバーのスペックをダウングレードする
  • B) タスク複雑度に応じたモデルルーティングとセマンティックキャッシュの組み合わせ
  • C) ログの保存期間を短くする
  • D) 開発者の人数を減らす
答えを見る

正解: B

APIトークン費用(60-80%)の削減には、モデルルーティング(簡単なタスクを安価なモデルで処理、50-70%削減)とセマンティックキャッシュ(類似リクエストのキャッシュ返却、20-40%削減)の組み合わせが最も効果的です。品質を維持しながら大幅なコスト削減を実現できます。


Q7. カスケードパターンでGPT-4o-miniで処理後にGPT-4oにエスカレーションする判断基準は何ですか?

  • A) リクエストの到着順
  • B) GPT-4o-miniの出力の品質スコアが閾値を下回った場合
  • C) ランダムに選択
  • D) ユーザーが手動で選択
答えを見る

正解: B

カスケードパターンでは、低コストモデル(GPT-4o-mini)の出力に対して自動品質評価を行い、品質スコアが事前設定の閾値(例: 0.8)を下回った場合にのみ高性能モデル(GPT-4o)で再処理します。大半のリクエストが低コストモデルで十分な品質を達成するため、品質維持とコスト削減を両立できます。


Q8. A/Bテストで「統計的有意差なし」の結果が出た場合の適切な対応はどれですか?

  • A) Treatmentを強制的に採用する
  • B) サンプルサイズが十分であればTreatmentを棄却し、不十分であればテストを延長する
  • C) テストを中止して元に戻す
  • D) テスト設計を変更して再実施する
答えを見る

正解: B

統計的有意差なしの場合、2つの可能性があります。サンプルサイズが十分(事前計算した必要数以上)であれば、Treatmentに実質的な効果がないと判断して棄却します。サンプルサイズが不十分であれば、効果が小さい可能性があるためテスト期間を延長してデータを追加収集します。


Q9. フィードバックループで「暗黙的フィードバック」が「明示的フィードバック」より重要視される場面はどれですか?

  • A) 品質の厳密な測定が必要な場合
  • B) フィードバック回答率が低く、全ユーザーの行動データから品質シグナルを得たい場合
  • C) ユーザーの意見を直接収集したい場合
  • D) 法規制対応が必要な場合
答えを見る

正解: B

明示的フィードバック(Good/Badボタン等)の回答率は通常10-20%であり、サンプルに偏りがあります。暗黙的フィードバック(再質問、エスカレーション、離脱等)は全ユーザーから自動的に収集できるため、より代表的な品質シグナルを大量に得ることができます。


Q10. LLMOpsの成熟度を「Level 1(場当たり的)」から「Level 4(最適化)」に引き上げるために最も重要な投資は何ですか?

  • A) 最新のGPUサーバーの導入
  • B) モニタリング基盤、CI/CDパイプライン、コスト管理体制、データ駆動の改善サイクルの構築
  • C) AIモデルの自社開発
  • D) 社員全員へのAI研修
答えを見る

正解: B

Level 4(最適化)は、AIシステムの運用が自動化され、データに基づいて継続的に改善されている状態です。これを実現するには、可観測性のあるモニタリング基盤、安全なデプロイのCI/CDパイプライン、FinOpsによるコスト管理体制、A/Bテストとフィードバックループによるデータ駆動の改善サイクルが不可欠です。


結果

8問以上正解の場合

合格です。Month 6「本番AIシステムを運用しよう」を修了しました。 LLMOpsの全体像、サービング基盤、モニタリング、コスト最適化、継続的改善サイクルの設計力が身につきました。

AI Track Month 4〜6の全カリキュラムを完了しました。おめでとうございます。

7問以下の場合

もう少し復習しましょう。

問題復習セクション
Q1Step 1: LLMOps入門
Q2Step 2: モデルデプロイとサービング基盤
Q3Step 3: プロンプトログ収集
Q4Step 3: ドリフト検出
Q5Step 3: アラートとダッシュボード
Q6Step 4: コスト最適化戦略
Q7Step 4: モデル選択最適化
Q8Step 5: A/Bテスト
Q9Step 5: フィードバックループ
Q10Step 6: 総合演習

推定所要時間: 30分