Fine-tuning判断 - L0 カリキュラム

ストーリー

田

田中VPoE

A/Bテストとフィードバックループを学んだ。最後にFine-tuningの判断基準を押さえよう

あなた

プロンプトエンジニアリングで改善できない場合にFine-tuningを検討するんですよね？

あ

田

田中VPoE

その通り。Fine-tuningは強力だがコストも高い。「いつFine-tuningすべきか」の判断基準を明確にしておくことが重要だ

あなた

コスト対効果を踏まえた判断基準を知りたいです

あ

Fine-tuning判断のフレームワーク

いつFine-tuningを検討するか

条件	Fine-tuningが有効	プロンプト改善で十分
タスクの特殊性	業界特有の専門用語、独自フォーマット	一般的なタスク
出力の一貫性	厳密なフォーマット・トーンの統一が必要	ある程度の揺れが許容
レイテンシ要件	長いプロンプトが必要で高速化したい	レイテンシに余裕がある
コスト	プロンプトが非常に長く、短縮したい	プロンプトが短い
データ量	高品質な学習データが1,000件以上ある	データが不足

判断フローチャート

[改善が必要]
    │
    ▼
[プロンプト改善を試みた？]
├→ No → プロンプトエンジニアリングを先に実施
│
├→ Yes、効果不十分
│   │
│   ▼
│   [RAG/Few-shotを試みた？]
│   ├→ No → RAGまたはFew-shotを先に実施
│   │
│   ├→ Yes、効果不十分
│   │   │
│   │   ▼
│   │   [高品質データが1,000件以上？]
│   │   ├→ No → データ収集を先に実施
│   │   │
│   │   └→ Yes → Fine-tuning検討
│   │
│   └→ Yes、十分な改善 → 完了
│
└→ Yes、十分な改善 → 完了

Fine-tuningのコスト比較

アプローチ	初期コスト	運用コスト	品質	柔軟性
プロンプト改善	低	中（トークン費用）	中	高
RAG	中	中	中〜高	高
Fine-tuning	高	低（短いプロンプト）	高	低

継続的改善のまとめ

改善手段の優先順位

1. プロンプトエンジニアリング（最初に試す）
   └→ コスト: 低、効果: 中、速度: 即日

2. RAG / Few-shot最適化
   └→ コスト: 中、効果: 中〜高、速度: 1-2週間

3. モデル切替（より適切なモデルの選定）
   └→ コスト: 低、効果: 中、速度: 1週間

4. Fine-tuning（最後の手段）
   └→ コスト: 高、効果: 高、速度: 2-4週間

まとめ

要素	ポイント
判断基準	プロンプト→RAG→モデル切替→Fine-tuningの順に検討
Fine-tuning条件	専門性が高い、一貫性が必要、データが十分
コスト比較	Fine-tuningは初期コスト高だが運用コストは低い

チェックリスト

Fine-tuningを検討すべき条件を理解した
改善手段の優先順位を把握した
コスト対効果の比較ができる

次のステップへ

次は演習で、継続的改善プランを実際に設計します。

推定読了時間: 15分