演習：エージェント評価改善計画を策定しよう

「エージェントの品質を継続的に改善する体制を作ろう。」

田中VPoEが指示する。

「応答品質、顧客満足度、エスカレーション最適化を含む包括的な評価改善計画を策定してくれ。」

ミッション概要

NetShop社カスタマーサポートAIエージェントの評価改善計画を策定する。

Mission 1: 品質評価体制（20分）

LLM-as-Judgeを活用した自動品質評価体制を設計せよ。

解答例

=== 品質評価体制 ===

■ 自動評価
- LLM-as-Judge: 全回答の5軸評価を日次で実行
- 閾値: 各軸3.5点未満をフラグ
- サンプルレビュー: フラグ付き回答の10%を人間が再評価

■ モニタリング指標
| 指標 | 目標 | チェック頻度 |
|------|------|-------------|
| 平均品質スコア | >= 4.0/5.0 | 日次 |
| 低品質回答率 | <= 5% | 日次 |
| ハルシネーション率 | <= 1% | 週次 |
| CSAT | >= 4.0 | 週次 |

Mission 2: 顧客満足度改善計画（20分）

CSAT向上のためのアクションプランを策定せよ。

解答例

=== CSAT改善計画 ===

■ 現状分析
CSAT 3.5 → 目標 4.0
低スコアの主因: 回答の網羅性不足（42%）、対応遅延（28%）

■ アクション
1. FAQ拡充: 低スコア回答のカテゴリでFAQを30件追加
2. プロンプト改善: 網羅性チェックを回答生成プロンプトに追加
3. 応答速度: キャッシュ導入で平均3秒→1秒に短縮
4. エスカレーション: 怒りの検知精度向上

■ KPI
- 1ヶ月後: CSAT 3.7
- 2ヶ月後: CSAT 3.9
- 3ヶ月後: CSAT 4.0

Mission 3: エスカレーション最適化（20分）

エスカレーション閾値の最適化計画を策定せよ。

解答例

=== エスカレーション最適化 ===

■ 現状
エスカレーション率: 25%、不要エスカレ率: 40%、見逃し率: 5%

■ 最適化
- 確信度閾値: 0.5 → 0.4（見逃し削減）
- フラストレーション閾値: 4 → 3（安全側）
- ルール追加: 金額10万円以上、法的キーワード

■ 目標
- エスカレーション率: 25% → 18%
- 不要エスカレ率: 40% → 15%
- 見逃し率: 5% → 2%

■ 検証
2週間のシャドー運用で効果を検証後、本番適用

達成度チェック

LLM-as-Judgeによる自動品質評価体制を設計した
CSAT改善のアクションプランを策定した
エスカレーション閾値最適化計画を策定した
各計画にKPIと期限を含めた

推定所要時間: 60分