クイズの説明
Step 4で学んだDocument AIによる文書処理について理解度をチェックします。
- 全5問
- 合格ライン: 80%(4問正解)
- 不合格の場合は復習してから再挑戦してください
問題
Q1. Document AIとOCRの最も大きな違いは何ですか?
- A) Document AIはOCRより高速に文字を認識できる
- B) Document AIは文書の構造を理解し、フィールドの意味まで抽出できる
- C) Document AIは手書き文字を認識でき、OCRは印刷文字のみ対応する
- D) Document AIはクラウドで動作し、OCRはローカルで動作する
答えを見る
正解: B
OCRは「文字を読む」ことが目的ですが、Document AIは文書の構造(レイアウト、テーブル、キー-バリューペア)を理解し、「この数字は金額で、この文字列は会社名だ」と意味レベルでのフィールド抽出を行います。処理速度や動作環境の違いではなく、理解の深さが本質的な違いです。
Q2. 請求書の自動処理において、「小計30,000円、税額2,400円、合計32,400円」というデータのバリデーションで検出すべき問題はどれですか?
- A) 特に問題はない(30,000 + 2,400 = 32,400で整合)
- B) 税率が8%で計算されているが、正しくは10%であるべき
- C) 合計金額が10万円未満なので自動処理対象外
- D) 小計が端数を含んでいないので不正
答えを見る
正解: A
小計30,000円に対して税額2,400円は税率8%(軽減税率)で計算されており、合計30,000 + 2,400 = 32,400円と整合しています。日本では消費税率は8%(軽減税率)と10%(標準税率)の2種類があるため、8%は有効な税率です。Bは誤りで、8%は食料品等に適用される軽減税率として正当です。
Q3. VLMベースの表抽出が、従来のテーブル検出モデルより優れている場面はどれですか?
- A) 明確な罫線がある定型の表
- B) 罫線がなくスペースで整列された表や結合セルのある表
- C) 数千ページの一括バッチ処理
- D) リアルタイムの表検出
答えを見る
正解: B
VLMは文脈理解力に優れているため、罫線がなくスペースやインデントで構造化された表や、結合セルのある複雑な表の認識に強みがあります。明確な罫線がある表(A)は従来手法でも高精度で、大量バッチ処理(C)やリアルタイム処理(D)ではVLMのコストやレイテンシが課題になります。
Q4. IDPパイプラインのHuman-in-the-Loopにおいて、人的レビューに回すべき条件として最も適切な組み合わせはどれですか?
- A) 全ての処理結果を人間が確認する
- B) AI信頼度が閾値未満、バリデーションエラー発生、高額取引の場合
- C) 処理時間が5秒を超えた場合のみ
- D) 新規取引先の請求書のみ
答えを見る
正解: B
Human-in-the-Loopでは、AI信頼度が閾値(例: 90%)を下回る場合、バリデーション(数値整合性等)でエラーが検出された場合、高額取引(例: 10万円以上)の場合に人的レビューに回すのが適切です。全件確認(A)では自動化の意味がなく、処理時間(C)や取引先の新規性(D)だけでは十分なリスク管理になりません。
Q5. 全社IDPプラットフォームを設計する際、新しい文書タイプの追加を容易にするために最も重要な設計原則はどれですか?
- A) 全ての文書タイプを1つの巨大なモデルで処理する
- B) 文書タイプごとにプラグイン(抽出・検証・登録のインターフェース)を定義し、共通処理層と分離する
- C) 文書タイプが増えるたびにシステム全体を再デプロイする
- D) 全ての文書を同じJSON形式に強制変換する
答えを見る
正解: B
プラグイン方式で文書タイプごとに抽出・検証・登録のインターフェースを定義し、共通処理層(取り込み、分類、前処理、モニタリング)と分離することで、新しい文書タイプの追加が容易になります。巨大モデル(A)は柔軟性が低く、全体再デプロイ(C)はリスクが高く、強制変換(D)は各文書の特性を活かせません。
結果
4問以上正解の場合
合格です。Step 4「Document AIで文書処理を革新しよう」を完了しました。 次はStep 5「マルチモーダルパイプラインを統合しよう」に進みましょう。
3問以下の場合
もう少し復習しましょう。
| 問題 | 復習セクション |
|---|---|
| Q1 | step4_1 Document Understanding |
| Q2 | step4_2 請求書・契約書処理(バリデーション) |
| Q3 | step4_3 表抽出と構造化 |
| Q4 | step4_4 インテリジェント文書処理(Human-in-the-Loop) |
| Q5 | step4_4 インテリジェント文書処理(プラグイン設計) |
推定所要時間: 30分