LESSON 30分

ストーリー

田中VPoE
コスト最適化の手法を学んだ。だが最適化は一度やれば終わりじゃない。予算管理とガバナンスの仕組みがないと、すぐに元に戻る
あなた
「最適化した翌月にまたコストが跳ね上がった」という話はよく聞きます
田中VPoE
そうだ。開発者が新しいリソースを作る。テスト用のインスタンスが消されない。キャンペーンで一時的にスケールアウトして戻し忘れる — コスト増加の原因は無数にある。だから仕組みとしてのガバナンスが必要だ
あなた
ルールを作るだけでなく、自動で制御する仕組みが必要ですね
田中VPoE
その通り。予算アラート、コスト上限の自動適用、承認フローの組み込み — 人間の注意力に頼らない仕組みを設計しよう

予算管理フレームワーク

予算の階層構造

全社クラウド予算(年間)
├── AWS予算
│   ├── 本番環境
│   │   ├── コアSaaSプロダクト
│   │   ├── 決済処理
│   │   └── 共通インフラ
│   ├── 開発・ステージング
│   └── 予備費(10%)
├── GCP予算
│   ├── データ分析基盤
│   ├── ML基盤
│   └── 予備費(10%)
├── Azure予算
│   ├── 認証・SSO基盤
│   ├── EU展開
│   └── 予備費(10%)
└── 全社予備費(5%)

予算策定プロセス

ステップ内容関係者
1. 実績分析過去12ヶ月の実績をベースにFinOps
2. 事業計画連動新規プロダクト、顧客増加を反映PM、経営
3. 最適化効果反映計画中の最適化による削減を見込むFinOps、SRE
4. バッファ設定予備費10-15%を確保経営
5. 承認CFO/CTOによる承認経営
6. 配分チーム・プロダクト単位に配分FinOps

コストガバナンスの仕組み

4つのガバナンスレイヤー

レイヤー目的実装
予防的制御コスト発生を事前に制限サービス制限、リソースクォータ
検知的制御異常を早期に発見予算アラート、異常検知
是正的制御問題を自動修正自動スケールダウン、リソース自動削除
指示的制御行動をガイドコスト意識の醸成、トレーニング

予算アラート設定

アラートレベル閾値アクション通知先
情報予算の70%コスト状況の共有チームリーダー
警告予算の85%最適化施策の実行催促チームリーダー + FinOps
危険予算の95%新規リソース作成の制限部門長 + FinOps + CTO
超過予算の100%承認なしの新規リソース作成を自動ブロック全関係者

自動コスト制御

自動化ポリシーの例

ポリシー条件アクション
開発環境自動停止平日19
/週末
EC2/VM停止、EKSスケールイン
未使用リソース削除30日間未使用警告→7日後に自動削除
スナップショット自動削除90日以上ステージング/開発のみ自動削除
異常コスト自動通知前日比150%以上Slack通知 + チケット自動作成
スポット中断時自動対応スポットインスタンス中断オンデマンドへの自動フォールバック

FinOpsレビューサイクル

頻度レビュー内容参加者
日次異常コストの確認、アラート対応FinOpsエンジニア
週次チーム別コストレビュー、最適化提案FinOps + チームリーダー
月次予算対実績レビュー、経営レポートFinOps + CTO + CFO
四半期割引契約の見直し、アーキテクチャレビューFinOps + SRE + 経営
年次予算策定、ベンダー契約交渉FinOps + 経営 + 法務

コスト配賦モデル

配賦の手法

手法説明メリットデメリット
直接配賦タグで直接チーム/プロダクトに紐付け正確タグ付け漏れがある
比例配賦使用量に応じて按分公平算出ロジックが複雑
均等配賦チーム数で均等分割シンプル大量利用チームに不公平
ショーバックコストを見せるが課金しない意識づけ行動変容に繋がりにくい
チャージバック実際に部門予算から課金強い行動変容運用が複雑

まとめ

ポイント内容
予算階層全社→クラウド別→環境別→プロダクト別の階層構造
4つの制御予防・検知・是正・指示のガバナンスレイヤー
自動化人間の注意力に頼らない自動コスト制御
レビューサイクル日次〜年次の定期的なFinOpsレビュー

チェックリスト

  • 予算管理の階層構造を設計できる
  • 4つのガバナンスレイヤーを理解した
  • 予算アラートの設計ができる
  • コスト配賦モデルの選択基準を理解した

次のステップへ

次は「演習:統合FinOpsダッシュボードを設計しよう」で、学んだフレームワークを使って実際のFinOps体制を設計します。


推定読了時間: 30分