総合確認クイズ

Month 6「画像・マルチモーダルデータで意思決定を支援しよう」の総合確認クイズである。10問中8問以上の正解（80%以上）で合格となる。

Q1. 転移学習

ImageNetで事前学習済みのResNet50を画像分類に使う利点はどれか？

A) ImageNetのクラスラベルをそのまま使える
B) 汎用的な画像特徴（エッジ、テクスチャ等）を既に学習しており、少量データでFine-tuningできる
C) 常にゼロから学習するより精度が低い
D) GPUが不要になる

正解: B) 汎用的な画像特徴（エッジ、テクスチャ等）を既に学習しており、少量データでFine-tuningできる

解説: ImageNetの120万枚で学習した低〜中レベルの特徴表現（エッジ、テクスチャ、形状）は多くの画像タスクに転用可能。最終層のみ入れ替えてFine-tuningすることで、少量データでも高精度が得られる。

Q2. Data Augmentation

医療画像分類でData Augmentationが重要な理由はどれか？

A) 画像の画質を向上させるため
B) 学習データが限られる中、データの多様性を人工的に増やし過学習を防ぐため
C) 推論速度を向上させるため
D) モデルサイズを削減するため

正解: B) 学習データが限られる中、データの多様性を人工的に増やし過学習を防ぐため

解説: 医療画像は取得コストが高く、データ数が限られることが多い。回転、反転、明るさ変更等のAugmentationでデータの多様性を増やし、モデルの汎化性能を向上させる。

Q3. Grad-CAM

Grad-CAMのヒートマップが病変部位と一致しない場合に考えられる問題はどれか？

A) 画像の解像度が低い
B) モデルが病変以外の特徴（背景、アーティファクト）で判断している可能性
C) Grad-CAMのアルゴリズムにバグがある
D) 問題はない

正解: B) モデルが病変以外の特徴（背景、アーティファクト）で判断している可能性

解説: Grad-CAMの注目領域が病変と一致しない場合、モデルはショートカット学習をしている可能性がある。例えば撮影機器の違いや背景パターンで判断している場合、実運用で精度が大幅に低下するリスクがある。

Q4. CLIP

CLIPのZero-shot分類が専門領域（医療画像等）で精度が低くなりがちな理由はどれか？

A) 画像サイズが大きいため
B) 事前学習データに専門領域の画像-テキストペアが十分に含まれていないため
C) CLIPのモデルサイズが小さいため
D) GPUメモリが不足するため

正解: B) 事前学習データに専門領域の画像-テキストペアが十分に含まれていないため

解説: CLIPはインターネット上の一般的な画像-テキストペアで学習しており、医療画像や農業画像の専門的なデータが不足している。そのため専門領域では転移学習によるFine-tuningが有効。

Q5. マルチモーダル融合

画像+テキスト(症状記述)の融合モデルが画像単体より精度が向上する理由はどれか？

A) パラメータ数が増えるため
B) 画像では捉えにくい情報（症状の経過、既往歴等）をテキストが補完するため
C) 計算量が減るため
D) データ量が2倍になるため

正解: B) 画像では捉えにくい情報（症状の経過、既往歴等）をテキストが補完するため

解説: 画像だけでは判断が難しいケース（見た目は軽度だが急速に進行中、過去に再発歴あり等）で、テキスト情報が補完的な手がかりを提供する。各モダリティの強みを活かした相補的な判断が可能になる。

Q6. VLM所見

VLMが生成した所見にdisclaimerを付与する最大の理由はどれか？

A) 法的義務のため
B) VLMはハルシネーションのリスクがあり、AI所見を最終的な診断と誤解されないようにするため
C) 所見の文字数を増やすため
D) ユーザー体験を向上させるため

正解: B) VLMはハルシネーションのリスクがあり、AI所見を最終的な診断と誤解されないようにするため

解説: VLMは画像にない情報を推測で記述するリスク（ハルシネーション）がある。AI所見はあくまで支援情報であり最終判断は専門家が行うことを明示するdisclaimerが、安全な運用に不可欠。

Q7. Sensitivity

Sensitivity 0.95、Specificity 0.85のスクリーニングモデルにおいて、1000人中50人が病気の集団に適用した場合の偽陰性（見逃し）数はいくつか？

A) 約2.5人
B) 約5人
C) 約50人
D) 約143人

正解: A) 約2.5人

解説: 病気50人のうちSensitivity 0.95で検出 → 50×0.95=47.5人が検出。見逃し = 50-47.5 = 2.5人。Sensitivity 0.95は病気の人の5%を見逃すことを意味する。

Q8. HITL

HITLで合意率（AIと専門家の一致率）が60%から85%に改善した場合の最大の意味はどれか？

A) AIの処理速度が向上した
B) AIの判断精度が向上し、自動承認率を安全に引き上げられる
C) 専門家の負担が増えた
D) コストが増加した

正解: B) AIの判断精度が向上し、自動承認率を安全に引き上げられる

解説: 合意率の向上はAIと専門家の判断が一致するケースが増えたことを意味し、AIの信頼性が高まった証拠。これにより自動承認の閾値を安全に下げ、専門家の負荷をさらに軽減できる。

Q9. 継続的学習

再学習時にチャンピオン/チャレンジャー方式を使う最大の理由はどれか？

A) 学習速度を上げるため
B) 新モデルが既存モデルより劣化していないことを確認してからデプロイするため
C) GPUコストを削減するため
D) データ量を増やすため

正解: B) 新モデルが既存モデルより劣化していないことを確認してからデプロイするため

解説: 再学習で必ずしもモデルが改善するとは限らない。新データの偏りやノイズにより劣化する可能性がある。チャンピオン/チャレンジャー方式で既存モデルと比較し、改善を確認してからデプロイすることで安全性を担保する。

Q10. 総合

画像AI診断支援システムの導入で最も重要な成功要因はどれか？

A) 最高精度のモデルを使うこと
B) 専門家との信頼関係構築とHuman-in-the-Loopによる段階的導入
C) すべてを自動化すること
D) 最新のVLMモデルを使うこと

正解: B) 専門家との信頼関係構築とHuman-in-the-Loopによる段階的導入

解説: 画像AI診断支援の成功は技術だけでなく、実際に使う専門家の信頼と受容にかかっている。Grad-CAMでの説明可能性、HITLでの段階的導入、フィードバックによる継続的改善を通じて、専門家との信頼関係を構築することが最重要。

結果

8問以上正解（80%以上）: 合格。Month 6「画像・マルチモーダルデータで意思決定を支援しよう」を修了。
7問以下: 各Stepのレッスンを復習してから再挑戦しよう。

推定所要時間: 30分