ストーリー
田
田中VPoE
「PoC設計の基本を学んだ。次はPoCの成功基準を具体的に設計する。曖昧な基準では、PoCが終わっても『成功だったのか失敗だったのか分からない』という事態に陥る。」
田
田中VPoE
「『高い』とは何%のことだ? 90%か、95%か、99%か。そして精度だけでなく、処理速度、コスト、ユーザビリティなど、複数の観点で判断する必要がある。」
成功基準の設計フレームワーク
3つの評価軸
| 評価軸 | 説明 | 指標例 |
|---|
| 技術的実現性 | AIが技術的に要求水準を満たすか | 精度、処理速度、安定性 |
| ビジネス効果 | 期待するビジネス成果が得られるか | コスト削減見込み、時間短縮 |
| 運用可能性 | 実際の業務で運用できるか | ユーザビリティ、保守性 |
各軸の具体的指標
技術的実現性
| 指標 | 定義 | 測定方法 |
|---|
| 精度(Accuracy) | 正解数 / 全体数 | テストデータでの正解率 |
| 適合率(Precision) | 正解数 / AI予測数 | 偽陽性の少なさ |
| 再現率(Recall) | 正解数 / 実際の正解数 | 見逃しの少なさ |
| F1スコア | 適合率と再現率の調和平均 | 総合的な精度指標 |
| 処理速度 | 1件あたりの処理時間 | 平均・95%ile・最大 |
ビジネス効果
| 指標 | 定義 | 測定方法 |
|---|
| 処理時間削減率 | (As-Is時間 - To-Be時間) / As-Is時間 | 同一タスクの処理時間比較 |
| コスト削減見込み | PoC結果からの年間削減額推計 | サンプルからの外挿計算 |
| 品質向上 | エラー率の変化 | PoC期間中のエラー計測 |
運用可能性
| 指標 | 定義 | 測定方法 |
|---|
| ユーザビリティ | 操作の容易さ | SUSスコア(68点以上) |
| 業務適合性 | 既存業務フローとの整合性 | 業務担当者の評価 |
| 保守性 | モデル更新の容易さ | 再学習にかかる工数 |
成功基準の段階設定
3段階の判定基準
必達基準(Must Have)
これを満たさなければ No-Go
例: 精度90%以上、処理時間30秒以内
│
▼
目標基準(Should Have)
これを満たせばGo判定
例: 精度95%以上、処理時間10秒以内
│
▼
理想基準(Nice to Have)
これを満たせば即座に本格展開
例: 精度98%以上、処理時間3秒以内
NetShop社 請求書AI-OCR PoCの成功基準
| 指標 | 必達基準 | 目標基準 | 理想基準 |
|---|
| 金額抽出精度 | 90% | 95% | 98% |
| 請求元名精度 | 85% | 92% | 97% |
| 処理速度/件 | 30秒以内 | 10秒以内 | 3秒以内 |
| 同時処理数 | 10件 | 50件 | 100件 |
| コスト/件 | 500円以下 | 200円以下 | 50円以下 |
| ユーザビリティ | SUS 60以上 | SUS 70以上 | SUS 80以上 |
判定プロセス
PoC判定会議のアジェンダ
| 議題 | 時間 | 内容 |
|---|
| 検証結果の報告 | 20分 | 各指標の実績値と達成状況 |
| 課題の共有 | 15分 | 検証中に発見された課題と対策案 |
| ビジネスインパクト推計 | 15分 | PoC結果から本番導入時の効果を推計 |
| Go/No-Go判定 | 10分 | 基準に基づく判定と次のアクション |
判定結果のパターン
| パターン | 条件 | アクション |
|---|
| Go | 目標基準を全て達成 | パイロット準備に移行 |
| Conditional Go | 必達基準は達成、目標基準の一部未達 | 改善策を講じてパイロットへ |
| Pivot | 必達基準の一部未達だが改善の見込みあり | スコープや技術を変更して再PoC |
| No-Go | 必達基準の大半が未達 | プロジェクト中止 or 大幅見直し |
まとめ
| 項目 | ポイント |
|---|
| 3つの評価軸 | 技術的実現性、ビジネス効果、運用可能性 |
| 段階設定 | 必達・目標・理想の3段階で基準を設定 |
| 定量化 | 全ての基準を数値で定義し、曖昧さを排除 |
| 判定プロセス | Go / Conditional Go / Pivot / No-Go の4パターン |
チェックリスト
次のステップへ
次は「PoC実行と結果分析」として、実際のPoC実施手順と結果の分析方法を学ぼう。
推定読了時間: 30分