Transformerクイズ

Step 4 で学んだ Transformer アーキテクチャの知識を確認しましょう。

Q1. Self-Attention の特徴

Self-Attention が RNN と比べて優れている点はどれですか？

正解: B

解説: Self-Attention は各トークンが他のすべてのトークンを直接参照できるため、長距離の依存関係を捉えやすく、また各位置の計算が独立しているため並列化が容易です。ただし計算量は O(n^2) で系列長が長いと増加し、順序情報は位置エンコーディングで明示的に与える必要があります。

Multi-Head Attention の目的として最も適切なものはどれですか？

正解: C

解説: Multi-Head Attention は入力を複数のヘッドに分割し、各ヘッドが異なる種類の関係（文法、意味、近接性など）を学習します。これにより、単一の Attention では捉えきれない多様な関係性を表現できます。

BERT と GPT の最も本質的な違いはどれですか？

正解: B

解説: BERT は Transformer の Encoder を使い、入力テキストの前後両方の文脈を参照します（双方向）。GPT は Decoder を使い、左から右へ順に生成する自己回帰モデルです。この設計の違いにより、BERT はテキスト理解、GPT はテキスト生成に適しています。

Transformer に位置エンコーディングが必要な理由はどれですか？

正解: B

解説: Self-Attention は集合（Set）に対する操作であり、入力の順序を区別しません。「猫が犬を追いかける」と「犬が猫を追いかける」が同じ表現になってしまいます。位置エンコーディングで各トークンに位置情報を付与することで、語順を考慮した処理が可能になります。

大規模言語モデル（LLM）のハルシネーションについて正しい説明はどれですか？

正解: B

解説: ハルシネーション（幻覚）は、LLM が存在しない事実や誤った情報をあたかも正しいかのように生成してしまう現象です。対策としては RAG（検索拡張生成）によるファクトチェック、信頼できるデータソースとの照合、人間によるレビューなどがあります。

5問中の正解数を確認してください。

推定所要時間: 30分