クイズの説明
Step 4で学んだプロンプトの評価と最適化に関するクイズです。全5問で、80%以上(4問以上正解)で合格です。
Q1: プロンプト評価の4つの軸として正しい組み合わせはどれですか?
- A) 正確性・速度・美しさ・創造性
- B) 正確性・一貫性・安全性・コスト効率
- C) 精度・再現率・F1スコア・AUC
- D) 入力品質・出力品質・レイテンシ・スループット
答えを見る
正解: B)
プロンプト評価の4つの軸は「正確性(Accuracy)」「一貫性(Consistency)」「安全性(Safety)」「コスト効率(Cost Efficiency)」です。C)は機械学習モデルの評価指標であり、プロンプト評価とは異なります。
Q2: A/Bテストにおいて、統計的有意性を確保するために最低限必要なテストケース数の目安はどれですか?
- A) 5件
- B) 10件
- C) 30件
- D) 1000件
答えを見る
正解: C)
統計的有意性を確保するためには、最低30件のテストケースが推奨されます。5-10件ではサンプル数が不足して偶然の結果を排除できず、1000件は多くの場合オーバーヘッドが大きすぎます。30件を難易度別(Easy/Medium/Hard各10件)に分配するのが実用的です。
Q3: プロンプトのセマンティックバージョニングで「v1.2.0 → v2.0.0」にMajorバージョンを上げるべきケースはどれですか?
- A) 誤字を修正した
- B) Few-shotの例を1件追加した
- C) 出力形式をJSON形式からMarkdown形式に変更した
- D) 禁止事項に1項目追加した
答えを見る
正解: C)
Majorバージョンの変更は、出力形式や動作が大幅に変わるBreaking Changeに適用します。JSON形式からMarkdown形式への変更は、出力を処理するパーサーの更新が必要な破壊的変更です。誤字修正はPATCH、例の追加や禁止事項追加はMINORに該当します。
Q4: LLM APIのコスト最適化において、最も効果が大きい施策の組み合わせはどれですか?
- A) 温度パラメータを下げる + max_tokensを増やす
- B) タスク複雑度に応じたモデルルーティング + FAQキャッシュ
- C) プロンプトを英語で書く + Few-shotの例を増やす
- D) 全リクエストで最高性能モデルを使用 + トークン数制限なし
答えを見る
正解: B)
コスト最適化で最も効果が大きいのは「モデルルーティング」と「キャッシュ」の組み合わせです。単純なタスクを軽量モデルに回すことでコストを大幅削減し、定型回答のキャッシュでAPI呼び出し自体を削減します。温度パラメータの変更やmax_tokensの増加はコスト最適化には直結しません。
Q5: プロンプトのロールバック戦略において、段階的ロールアウト(カナリアデプロイ)の正しい手順はどれですか?
- A) 100%のトラフィックに一気に適用し、問題があれば全戻し
- B) 5%→25%→50%→100%と段階的に新バージョンの適用率を上げ、各段階で品質指標を監視
- C) テスト環境でのみ実行し、本番には適用しない
- D) 旧バージョンを即座に削除し、新バージョンのみを保持
答えを見る
正解: B)
段階的ロールアウトでは、少数のトラフィック(5%)から新バージョンを適用開始し、品質指標(正確性、安全性等)を監視しながら段階的に適用率を上げます。問題が検出された段階で即座にロールバック可能です。一気に100%適用や旧バージョンの即削除はリスクが高い手法です。
結果
合格(80%以上)
おめでとうございます。プロンプトの評価・最適化・運用管理のスキルが身についています。Step 5では業務別のプロンプトテンプレート構築に進みましょう。
不合格(80%未満)
以下のステップを復習してから再挑戦してください。
- Q1を間違えた場合 → Step 4-1「プロンプト評価指標」を復習
- Q2を間違えた場合 → Step 4-2「A/Bテストとプロンプト改善」を復習
- Q3を間違えた場合 → Step 4-3「プロンプトバージョニング」を復習
- Q4を間違えた場合 → Step 4-4「コスト最適化」を復習
- Q5を間違えた場合 → Step 4-3「プロンプトバージョニング」のロールバック戦略を復習
推定所要時間: 30分