コストのアノマリー

DoiT Anomaly Detection（アノマリー検知）は、Google Cloud、Amazon Web Services、Microsoft Azure、Snowflake、Databricks、Datadog、OpenAI、ClickHouse Cloud、Cloudflare、Cursor、Elastic Cloud、GitHub、Grafana Cloud、Vercel のコストスパイクをエンドツーエンドで監視します。

検知サービスは、時系列モデリングを活用してデータを監視し、クラウド環境における支出トレンドを分析します。DoiT の顧客全体にわたる請求パターンを特定し、クラウド支出を予測し、より正確な結果を提供できるよう継続的に改善されています。確立された支出パターンと一致しない請求レコードは、潜在的なアノマリーとして特定されます。DoiT コンソールは、寄与リソースの一覧や AI 分析などの詳細情報を提供し、必要に応じて調査と是正対応を行う際に役立ちます。

以下のセクションでは、DoiT Anomaly Detection がどのように動作するかを説明します。

ソースデータ

DoiT Anomaly Detection は、次の 2 種類のソースデータをサポートします。

請求データ：クラウドプロバイダおよびサードパーティプラットフォームによるコストと使用量のデータ（例：AWS CUR、Google Cloud Billing データエクスポート、Azure billing export など）。
リアルタイム利用データ：ほぼリアルタイムのコストアノマリー検知のために、DoiT はリアルタイム利用データを活用して、次のサービスのコストを推定します。
- Amazon Elastic Compute Cloud（EC2）、Amazon Relational Database Service（RDS）：AWS CloudTrail から得られた使用量に基づき、オンデマンドコストを推定します。
- Google Compute Engine（GCE）：Google Cloud Audit Logs から得られた使用量に基づき、オンデマンドコストを推定します。
- Google BigQuery：BigQuery API とメタデータビューから得られた使用量に基づき、オンデマンドコストを推定します。

ベースライン期間

アノマリー検知システムは、新規登録後すぐにデータの分析を開始します。ただし、正確に検知するためには十分な履歴データが必要です。機械学習モデルが請求データおよびリアルタイムデータに基づく利用パターンの信頼できるベースラインを確立できるよう、請求データについて 14 日間、リアルタイム利用データについて 4 日間 をベースライン期間として設定しています。

アノマリー検知が業務上クリティカルな場合は、クラウド支出に大きな変更を加える前に、このベースライン期間が経過するまで待つことをおすすめします。ベースライン期間中は、いかなる支出もアノマリーとして分類されません。

集約レベル

アノマリー検知システムは、時系列モデルを活用して、SKU レベル と サービスレベル の両方でコストおよび使用量データを監視・評価します。履歴パターンを分析し、現在の利用トレンドと比較することで、重要なコストスパイクを検知するよう設計されています。異常なコストスパイクが検知されると、アノマリーアラートがトリガーされます。

請求データ

請求データについては、解決までの時間を短縮するため、アノマリー検知システムは主に SKU レベルで動作します。そのため、検知されるコストアノマリーの多くは SKU レベルのアノマリーとなります。

サービスレベルでの監視は、主に新しく作成されたプロジェクトや新しい SKU によって引き起こされる初期のスパイクに対応する補完的な役割を果たします。新しいプロジェクトが作成された場合、または新しい SKU にコストが発生し始めた場合、新しい時系列が識別され、コストデータの収集を開始します。しかし、十分な履歴データポイントがないため、新しい時系列は最初の数日間は SKU レベルのアノマリー候補を生成しません。「通常」の支出がまだ確立されていない間でも、新たに発生したコストによってサービスレベルではすでに異常なスパイクが生じている可能性があります。

リアルタイム利用データ

2025 年 5 月 21 日以降、時間単位の粒度を持つリアルタイム利用データに対するアノマリー検知システムは、高解像度サンプリングによるノイズを軽減するため、サービスレベルのみで動作します。

評価スコープ

システムによって評価されるデータサンプルは、次のように分割されます。

請求アカウントごと
プロジェクト／アカウントごと
サービスごと
SKU ごと
アロケーションごと（該当する場合）

評価スコープは集約レベルによって異なります。

SKU レベル：SKU、サービス、およびプロジェクト／アカウントごと（リージョンをまたいで集約）
サービスレベル：サービスごと（プロジェクトおよび SKU をまたいで集約）

検知システムは複数のサービスを合算したコストは評価しません。

判定基準

誤検知を軽減するため、アノマリー検知システムは、次のすべての条件を満たす場合にのみ、SKU またはサービスの支出をアノマリーとして分類します。

請求データ

1 日あたりの支出が最小閾値に達していること：
- SKU レベルのアノマリー：US$50
- サービスレベルのアノマリー：US$100
1 日あたりの支出が、月次の季節性を超えていること。
1 日あたりの支出が、システムの 通常範囲（または 許容範囲）の上限を超えていること。

リアルタイム利用データ

1 時間あたりの支出が US$10 の最小閾値に達していること。
1 時間あたりの支出が、システムの 通常範囲（または 許容範囲）の上限を超えていること。

感度

アノマリー検知システムは、直前の期間のデータで学習した時系列モデルを使用して、予測される支出を算出します。通常範囲は、DoiT 固有の予測区間によって決定されます。これは、あるパーセンテージの値が収まると見込まれる区間の推定値です。例えば、90% の予測区間には、モデルで当てはめられた過去の値に基づき、新しいデータポイントが取りうる値の 90% が含まれます。通常範囲は、コストアノマリーのチャート上で網掛けエリアとして表示されます。

DoiT コンソールでは、アノマリー感度設定を調整して予測区間を変更し、それによって通常範囲を再定義できます。感度を高くすると範囲が狭まり、検知されるアノマリーの数が増加します。感度を低くすると範囲が広がり、検知されるアノマリーの数が減少します。

検知レイテンシ

検知レイテンシは、ソースデータの種類によって異なります。

請求データ

多くの場合、集計コストが事前定義された閾値を超えると、12 時間以内に請求データのアノマリーが報告されます。

アノマリー検知エンジンは、使用量およびコストデータを定期的に評価します。SKU レベルおよびサービスレベルのアノマリーについては、2 時間ごとに評価が実行されます。

検知レイテンシは主に、クラウドプロバイダが使用量およびコストデータを報告する間隔の違いに関連します。データレイテンシも参照してください。

リアルタイム利用データ

アノマリー検知エンジンは、リアルタイム利用データを 30 分ごとに評価します。リアルタイム利用データによって検知されたアノマリーは、使用から 1 時間以内に報告されます。

動的な更新

進行中のアノマリーは Active と見なされます。検知システムは Active なアノマリーを継続的に監視し、利用可能な最新データでシステムを常に更新します。

次のいずれかの条件を満たすと、アノマリーは Inactive になります。

コストが新しい通常範囲内に戻った場合
アクティブ期間の上限に達した場合（請求データに基づく場合は 7 日間、リアルタイム利用データに基づく場合は 3 日間）

アノマリーが Active および Inactive になるタイミングの詳細は、コストアノマリーのチャートを参照してください。

コストアノマリーアラート

アノマリーが検知されると、システムは請求アカウント、サービス、およびプロジェクト ID を確認し、同じコンテキストに対して既にアラートが送信されていない場合にのみアラートがトリガーされるようにします。

これは、同じサービスに対して SKU レベルのアラートが送信されている場合、サービスレベルのアラートは送信されないことを意味します（その逆も同様です）。

ヒント

CloudFlow トリガーを使用して、コストアノマリーへの対応を自動化できます。例えば、アノマリーが検知されたとき、そのステータスやコストが変化したとき、またはアノマリーが確認されたときにフローを開始することができます。フローを開始できるイベントの全一覧については、Cost anomaly events を参照してください。

月初のスパイク

一部のサービスでは、月初の 1 日に一括請求が行われるため、月の他の日と比べて不釣り合いなコストスパイクが発生する場合があります。ただし、その金額が過去数か月と同程度であれば、アノマリーとは見なされません。

精度を高めるために、月初のコストを評価する際には、アノマリー検出モデルは日次コストのモデリングに加えて、月次での比較も行います。（ほぼリアルタイムのアノマリー検出では、より短期間をより詳細に評価するため、月次の季節性は考慮されません。）

以下は評価対象のサービス一覧です。

月初にコストスパイクが発生するサービス

Amazon API Gateway
Amazon CloudWatch
Amazon Cognito
Amazon DynamoDB
Amazon ElastiCache
Amazon GuardDuty
Amazon Managed Service for Prometheus
Amazon OpenSearch Service
Amazon Redshift
Amazon Rekognition
Amazon Relational Database Service
Amazon Route 53
Amazon WorkSpaces
AWS Certificate Manager
AWS Data Transfer
AWS Elemental MediaConvert
AWS End User Messaging
AWS Identity and Access Management Access Analyzer
AWS Outposts
AWS Shield
Bright Data Enterprise non metered
Cloud Navigator
Compute Engine
Contact Center Telecommunications (service sold by AMCS, LLC)
Coralogix
Datadog
Datadog Pro
Directions API
Drata Security & Compliance Automation Platform
Fastly for GCP Marketplace
Geocoding API
Geolocation API
Grafana Cloud observability: Grafana, Prometheus metrics, logs, traces
HYCU R-Cloud™ Platform
Identity Platform
JFrog DevOps Platform - Enterprise X
JFrog Software Supply Chain Platform
Looker Studio
Maps API
Maps Static API
Office LTSC Professional Plus 2021
Places API
Plerion Cloud Security Platform (Contract)
Snyk: Developer Security Platform
Twilio Segment
Vantage Cloud Cost Platform - Enterprise
WIZ Cloud Infrastructure Security Platform

FAQ

コストのスパイクがアノマリーとして報告されなかったのはなぜですか？

アノマリー検出システムは、SKU レベルとサービスレベルの 2 つのレベルでコストを評価します。複数サービスにまたがる複数の SKU を合算したコストは評価しません。

クラウドコストのスパイクがアノマリーとして検出されなかった場合、まずそのスパイクが複数サービスにまたがる SKU によって発生していないかを確認することが重要です。加えて、その支出がアノマリーとして認定されるためには、特定の条件セットを満たしている必要があります。

アノマリー検出はコストアラートとどう違いますか？

アノマリー検出は、以下の点でコストアラートと異なります。

範囲: アノマリー検出は個々の SKU とサービスを監視しますが、コストアラートの対象範囲はより柔軟です。
条件: アラートをトリガーする条件は単一の閾値です（例: 週間コストが 5.00% 増加）。一方、アノマリーとして分類されるには、コストが複数の条件を満たす必要があります。
客観性: アラートは客観的な閾値に反応しますが、アノマリー検出はフィットさせた時系列モデルによって確立された予測支出パターンも考慮します。

一般的に、アラートはアノマリー検出よりも「敏感」で、トリガーされやすい傾向があります。

コストアノマリーアラートとそのレポートはどう違いますか？

データ値

コストアノマリーアラートに含まれるチャートは、検出時点の請求データのスナップショットを示します。

対応するレポート（レポートで開くボタンからアクセス）では、最新のデータが反映されるため、直近の時点では値が若干異なる場合があります。

データの利用可能性

アノマリー検出システムは、アラートを迅速に送信するために、利用可能な中で最新の請求データを使用します。

レポートでは、より詳細なテーブルを使用するため追加の処理が必要となり、その結果としてデータの利用可能性に遅延が発生します。そのため、アラートをトリガーした請求データが、アラート送信時点では一時的にレポート上で利用できない場合があります。

▶️ インタラクティブデモ

インタラクティブデモを試して、実際に操作しながら機能を体験してください。

デモが正しく表示されない場合は、ブラウザウィンドウを拡大するか、新しいタブでデモを開いてみてください。

参照

FinOps Foundation: Managing Cloud Cost Anomalies

ソースデータ​

ベースライン期間​

集約レベル​

請求データ​

リアルタイム利用データ​

評価スコープ​

判定基準​

請求データ​

リアルタイム利用データ​

感度​

検知レイテンシ​

請求データ​

リアルタイム利用データ​

動的な更新​

コストアノマリーアラート​

月初のスパイク​

FAQ​

コストのスパイクがアノマリーとして報告されなかったのはなぜですか？​

アノマリー検出はコストアラートとどう違いますか？​

コストアノマリーアラートとそのレポートはどう違いますか？​

データ値​

データの利用可能性​

▶️ インタラクティブデモ​

ソースデータ

ベースライン期間

集約レベル

請求データ

リアルタイム利用データ

評価スコープ

判定基準

請求データ

リアルタイム利用データ

感度

検知レイテンシ

請求データ

リアルタイム利用データ

動的な更新

コストアノマリーアラート

月初のスパイク

FAQ

コストのスパイクがアノマリーとして報告されなかったのはなぜですか？

アノマリー検出はコストアラートとどう違いますか？

コストアノマリーアラートとそのレポートはどう違いますか？

データ値

データの利用可能性

▶️ インタラクティブデモ