チェックポイント - L0 カリキュラム

クイズの説明

Step 5「評価パイプラインを構築しよう」の理解度を確認します。全6問、80%以上正解で合格です。

答えを見る

正解: B

Faithfulness（忠実度）は、生成された回答の各主張が検索されたコンテキスト（ドキュメント）によって裏付けられているかを測定します。ハルシネーションの検出に重要です。

答えを見る

正解: B

入力ドリフトは、ユーザーの質問傾向が変化することです。質問をエンベディング化し、その分布をKLダイバージェンス等の統計手法で時系列比較することで検知できます。

答えを見る

正解: B

LLM-as-Judgeは、別のLLM（評価用モデル）を使って生成された回答の品質を自動的にスコアリングする手法です。人間の評価と高い相関を示し、大規模な自動評価に適しています。

答えを見る

正解: C

RAGの評価には、質問（入力）、正解（期待される回答）、参照すべきコンテキスト（正解を導く文書）の3要素が必要です。これによりContext Recall等のメトリクスも計算可能になります。

答えを見る

正解: B

ハルシネーション率の上昇は、検索されるコンテキストの品質低下が原因であることが多いです。最近のドキュメント更新、削除、インデックスの再構築などの変更が影響していないか確認します。

答えを見る

正解: B

フィードバックを体系的に収集し、「プロンプト問題」「ドキュメント不足」「検索精度」等に分類して、それぞれ適切な改善アクションに繋げるプロセスが重要です。

合格です。 評価パイプラインとモニタリングの知識を理解しています。総合演習に進みましょう。

もう少し復習しましょう。 RAGAS、ドリフト検知、フィードバックループを確認してください。