ストーリー
田
田中VPoE
「AI適用判断マトリクス、データ評価、技術フィット、リスクアセスメントを学んだ。ここからはNetShop社の具体的なユースケース候補8件について、総合的にAI適用可否を判断してもらう。」
あなた
「Step 2で特定した候補を、Step 3の手法で評価するんですね。」
あ
田
田中VPoE
「そうだ。最終的には経営会議で『この業務にはAIを適用すべき、この業務には別の手段が適切』と根拠を持って説明できるレベルの判断書を作ってくれ。」
あなた
「わかりました。データ、技術、リスクの3つの観点から総合判断します。」
あ
ミッション概要
| 項目 | 内容 |
|---|
| 演習タイトル | NetShop社のAI適用可否判断 |
| 想定時間 | 90分 |
| 成果物 | AI適用判断レポート(8件の候補評価 + 技術選定 + リスク対策) |
| 評価対象 | 8件のAI活用候補 |
評価対象の候補一覧
| No. | 候補 | 部門 | 概要 |
|---|
| 1 | FAQ自動回答 | CS | 問い合わせの40%を占める定型質問をAIで自動回答 |
| 2 | 商品説明文生成 | EC | 新商品登録時の説明文をAIでドラフト作成 |
| 3 | 需要予測 | 物流 | 過去の販売データから将来の需要を予測 |
| 4 | 不正注文検知 | EC | 不正な注文パターンをリアルタイム検知 |
| 5 | 出荷検品自動化 | 物流 | 画像認識による出荷物の自動検品 |
| 6 | レビュー不適切検出 | EC | 不適切なレビューの自動検出・フラグ付け |
| 7 | 広告コピー最適化 | マーケ | A/Bテスト用の広告文をAIで大量生成 |
| 8 | 経費精算自動化 | 管理 | 領収書OCR+経費科目の自動分類 |
Mission 1: AI適用判断マトリクス評価
要件
8件の候補について、4軸(データ、定型度、頻度、効果)でスコアリングし、AI適用スコアを算出してください。
- 各候補の4軸スコア(1-5)と根拠
- 重み付き総合スコアの算出
- スコアによる判定(強く推奨/推奨/要検討/非推奨)
解答例
4軸スコアリング
| No. | 候補 | データ(×0.30) | 定型度(×0.25) | 頻度(×0.20) | 効果(×0.25) | スコア | 判定 |
|---|
| 1 | FAQ自動回答 | 5 (1.50) | 5 (1.25) | 5 (1.00) | 5 (1.25) | 5.00 | 強く推奨 |
| 2 | 商品説明文生成 | 4 (1.20) | 3 (0.75) | 4 (0.80) | 4 (1.00) | 3.75 | 推奨 |
| 3 | 需要予測 | 4 (1.20) | 3 (0.75) | 3 (0.60) | 5 (1.25) | 3.80 | 推奨 |
| 4 | 不正注文検知 | 3 (0.90) | 4 (1.00) | 4 (0.80) | 4 (1.00) | 3.70 | 推奨 |
| 5 | 出荷検品自動化 | 2 (0.60) | 5 (1.25) | 5 (1.00) | 3 (0.75) | 3.60 | 推奨 |
| 6 | レビュー不適切検出 | 4 (1.20) | 4 (1.00) | 4 (0.80) | 3 (0.75) | 3.75 | 推奨 |
| 7 | 広告コピー最適化 | 3 (0.90) | 3 (0.75) | 3 (0.60) | 3 (0.75) | 3.00 | 推奨 |
| 8 | 経費精算自動化 | 2 (0.60) | 4 (1.00) | 2 (0.40) | 2 (0.50) | 2.50 | 要検討 |
判定根拠
- FAQ自動回答: Zendeskに過去ログが豊富、定型質問が40%、月3万件の高頻度、CS50名の工数削減効果大
- 経費精算自動化: 経理ソフトがオンプレでデータ取得困難、月次頻度で件数少、効果も限定的
Mission 2: 技術フィット評価
要件
上位6件(スコア3.0以上)について、最適な技術を選定してください。
- 各候補に対する最適技術の選定と根拠
- ハイブリッドアプローチが有効な場合はその設計
- 代替技術の提案(コスト削減や初期段階向け)
解答例
技術選定
| No. | 候補 | 最適技術 | 根拠 | 代替技術 |
|---|
| 1 | FAQ自動回答 | 生成AI(RAG) | 多様な質問への柔軟な対応が必要 | ルールベースFAQ(初期版) |
| 2 | 商品説明文生成 | 生成AI | 自然な日本語テキストの生成が核心 | テンプレート+変数置換 |
| 3 | 需要予測 | 従来型ML(回帰) | 過去データからのパターン学習 | 統計手法(移動平均、ARIMA) |
| 4 | 不正注文検知 | 従来型ML(異常検知) | 正常パターンからの逸脱検出 | ルールベース(閾値判定) |
| 5 | 出荷検品自動化 | 画像認識AI | 画像による商品識別が必要 | バーコード検品の強化 |
| 6 | レビュー不適切検出 | 生成AI + ML | テキスト理解+分類の組み合わせ | キーワードフィルタ |
ハイブリッドアプローチ例: FAQ自動回答
1. ルールベース: キーワードマッチングで定型質問を高速回答
↓(マッチしない場合)
2. 生成AI(RAG): ナレッジベースから関連情報を検索し回答生成
↓(信頼度が低い場合)
3. 有人対応: オペレーターにエスカレーション
Mission 3: リスク評価と対策
要件
上位6件について、リスクアセスメントを実施してください。
- 各候補の主要リスクの特定(技術/業務/倫理/法規制)
- リスクの影響度×発生確率の評価
- 具体的な対策の策定
- 総合判断: Go(推進)/ Conditional Go(条件付き推進)/ No Go(見送り)
解答例
リスク評価
| No. | 候補 | 主要リスク | カテゴリ | 影響度 | 発生確率 | 対策 |
|---|
| 1 | FAQ自動回答 | ハルシネーションによる誤回答 | 技術 | 高 | 中 | RAGで根拠データ提供、信頼度スコア設定、低信頼時は有人切替 |
| 1 | FAQ自動回答 | 個人情報の漏洩 | 法規制 | 高 | 低 | 個人情報マスキング、DLP導入 |
| 2 | 商品説明文生成 | 虚偽表示(景品表示法) | 法規制 | 高 | 中 | 人間による最終レビュー必須化 |
| 3 | 需要予測 | 予測精度不足による過剰在庫 | 業務 | 中 | 中 | 安全在庫の設定、予測値の信頼区間表示 |
| 4 | 不正注文検知 | 正常注文の誤判定(偽陽性) | 業務 | 高 | 中 | 人間レビューフロー設計、閾値の段階的調整 |
| 5 | 出荷検品自動化 | 検品漏れによる誤出荷 | 業務 | 高 | 低 | AI+人間のダブルチェック体制 |
| 6 | レビュー検出 | 正当なレビューの誤削除 | 倫理 | 中 | 中 | フラグのみ(自動削除はしない)、人間が最終判断 |
総合判断
| No. | 候補 | AI適用スコア | リスクレベル | 総合判断 | 理由 |
|---|
| 1 | FAQ自動回答 | 5.00 | 中 | Go | 高スコア、リスクは対策可能 |
| 2 | 商品説明文生成 | 3.75 | 中 | Conditional Go | 人間レビュー必須を条件に推進 |
| 3 | 需要予測 | 3.80 | 中 | Conditional Go | 安全在庫との併用を条件に推進 |
| 4 | 不正注文検知 | 3.70 | 高 | Conditional Go | 人間レビュー必須、段階的導入を条件 |
| 5 | 出荷検品自動化 | 3.60 | 中 | Conditional Go | 画像データ収集完了を前提条件 |
| 6 | レビュー検出 | 3.75 | 低 | Go | 人間判断を残すため、リスク低 |
達成度チェック
| 観点 | 達成基準 |
|---|
| 4軸評価 | 8件すべてのスコアに根拠がある |
| 技術選定 | 業務特性と技術特性が整合している |
| ハイブリッド設計 | 複数技術の組み合わせが現実的 |
| リスク評価 | 4カテゴリ(技術/業務/倫理/法規制)を網羅 |
| 対策の具体性 | リスクに対する具体的な対策が記載されている |
| 総合判断 | Go/Conditional Go/No Goの判断に一貫性がある |
推定所要時間: 90分