クイズの説明
Step 4で学んだコスト最適化戦略について理解度をチェックします。
- 全10問
- 合格ライン: 80%(8問正解)
- 不合格の場合は復習してから再挑戦してください
問題
Q1. LLMシステムのコスト構造で、最も大きな割合を占めるコスト項目はどれですか?
- A) サーバーインフラ費用
- B) APIトークン費用(60-80%)
- C) 開発者の人件費
- D) ログストレージ費用
答えを見る
正解: B
LLMシステムのコストの60-80%はAPIのトークン費用が占めます。入力トークンと出力トークンの従量課金が主なコストドライバーです。そのため、トークン使用量の最適化が最も大きなコスト削減効果をもたらします。
Q2. セマンティックキャッシュが完全一致キャッシュより優れている点は何ですか?
- A) 実装が簡単
- B) キャッシュのストレージが小さい
- C) 意味的に類似した質問にもヒットするため、ヒット率が大幅に向上する
- D) キャッシュの更新が不要
答えを見る
正解: C
セマンティックキャッシュは埋め込みベクトルの類似度でマッチングするため、「返品方法を教えて」と「商品を返したいのですが」のように表現が異なるが意味が同じ質問にもヒットします。完全一致キャッシュのヒット率5-10%に対し、20-40%のヒット率を実現できます。
Q3. カスケードパターンでモデルを使い分ける際の正しいフローはどれですか?
- A) 高性能モデルで処理→低コストモデルで検証
- B) 低コストモデルで処理→品質不足なら高性能モデルにエスカレーション
- C) ランダムにモデルを選択
- D) 交互にモデルを切り替え
答えを見る
正解: B
カスケードパターンでは、まず低コストモデル(例: GPT-4o-mini)で処理し、品質スコアが閾値を下回った場合にのみ高性能モデル(例: GPT-4o)にエスカレーションします。大半のリクエストが低コストモデルで処理されるため、品質を維持しながら大幅なコスト削減が可能です。
Q4. Batch APIを使用する最大のメリットは何ですか?
- A) レイテンシが改善される
- B) モデルの精度が向上する
- C) 通常価格の50%でAPIを利用でき、即時性が不要な処理のコストを半減できる
- D) APIの同時接続数が増える
答えを見る
正解: C
Batch APIは通常のAPI呼び出しの50%の価格で利用でき、処理結果は24時間以内に返却されます。レポート生成や商品説明の一括生成など、即時性が不要なタスクに適しており、対象処理のコストを半減できます。
Q5. プロンプト圧縮でFew-shotの例を5つから2つに削減した場合の影響として最も正確なものはどれですか?
- A) 品質が必ず低下する
- B) トークン数が削減されるが、代表的な例を選べば品質への影響は最小限に抑えられる
- C) 品質は必ず向上する
- D) コストには影響しない
答えを見る
正解: B
Few-shot例の削減はトークン数の直接的な削減につながります。ただし、最も代表的で多様な例を選択すれば、5つの例とほぼ同等の品質を2つの例で達成できることが多いです。タスクの複雑度に応じて、削減後の品質を検証することが重要です。
Q6. AI FinOpsの3つの柱として正しい組み合わせはどれですか?
- A) 開発、テスト、デプロイ
- B) 可視化(Inform)、最適化(Optimize)、運営(Operate)
- C) 計画、実行、評価
- D) 予算、監視、削減
答えを見る
正解: B
AI FinOpsは「可視化(Inform)」でコストを見える化し、「最適化(Optimize)」で技術的な改善を行い、「運営(Operate)」で組織的にコストを管理する3つの柱で構成されます。
Q7. コスト配賦(チャージバック)を導入する目的は何ですか?
- A) 各部門にAI利用を禁止させるため
- B) AI利用コストを部門別に可視化し、各部門にコスト意識と最適化のインセンティブを与えるため
- C) 全てのコストをIT部門に集約するため
- D) コストを隠蔽するため
答えを見る
正解: B
コスト配賦は各部門が自分たちのAI利用コストを認識し、コスト意識を持つことで、不要な利用の削減や効率化のインセンティブを生み出します。「使い放題」の状態ではコスト最適化が進みにくく、配賦により自発的な最適化が促進されます。
Q8. セマンティックキャッシュの類似度閾値を0.95から0.85に下げた場合の影響は何ですか?
- A) キャッシュヒット率が上がるが、不適切なキャッシュ返却のリスクも増加する
- B) キャッシュヒット率が下がる
- C) キャッシュの保存容量が増える
- D) APIコストが増加する
答えを見る
正解: A
類似度閾値を下げると、より広い範囲の質問がキャッシュにヒットするようになり、ヒット率は向上します。一方で、実際には異なる意味の質問にも誤ってキャッシュが返却されるリスクが高まり、品質低下の可能性があります。閾値は品質とヒット率のバランスで調整します。
Q9. コスト最適化で最初に着手すべき施策の特徴はどれですか?
- A) 最も技術的に高度な施策
- B) 実装が容易で削減額が大きい(ROIが高い)施策
- C) 最も新しい技術を使う施策
- D) 全システムに横断的に適用する施策
答えを見る
正解: B
コスト最適化では「クイックウィン」を最初に狙います。実装コストが低く、短期間で実現でき、削減効果が大きい施策(例: 全件GPT-4oをモデルルーティングで最適化)から着手することで、早期に成果を示し、組織の最適化へのモメンタムを作れます。
Q10. 月間AI予算の消化率が月中で80%に達した場合、最も適切な対応はどれですか?
- A) 残りの予算内で全システムを均等に制限する
- B) コスト急増の原因を特定し、不要なリクエストの削減やモデルの一時的な切替を検討する
- C) 予算を追加申請する
- D) 全AIシステムを停止する
答えを見る
正解: B
予算の早期消化は異常な利用パターンの兆候である可能性があります。まず原因(リクエスト数の急増、トークン肥大化、不要なリクエスト)を特定し、影響の少ない方法でコストを抑制します。ビジネスクリティカルなシステムは維持しつつ、低優先度の処理を一時的に制限することが適切です。
結果
8問以上正解の場合
合格です。Step 4「コスト最適化戦略」を完了しました。 次はStep 5「継続的改善サイクル」に進みましょう。
7問以下の場合
もう少し復習しましょう。
| 問題 | 復習セクション |
|---|---|
| Q1 | step4_1 コスト構造の理解 |
| Q2 | step4_2 キャッシング戦略 |
| Q3 | step4_3 モデル選択最適化 |
| Q4 | step4_3 モデル選択最適化 |
| Q5 | step4_3 モデル選択最適化 |
| Q6 | step4_4 Token最適化とFinOps |
| Q7 | step4_4 Token最適化とFinOps |
| Q8 | step4_2 キャッシング戦略 |
| Q9 | step4_1 コスト構造の理解 |
| Q10 | step4_4 Token最適化とFinOps |
推定所要時間: 30分