BigQuery Intelligence
サーバーレスでマルチクラウドのデータ分析プラットフォームである Google Cloud BigQuery の価格は、主にクエリ処理コストに関するコンピュートの価格と、データの保存コストに関するストレージの価格の 2 つで構成されます。
DoiT BigQuery Intelligence は BigQuery の使用状況を分析し、コンピュートとストレージの両方に対して実行可能な推奨事項を生成します。これにより、クラウドコストの効率を最大化し、クエリのパフォーマンスを向上させ、データの拡大に伴う持続可能な 成長を実現します。
データセットと監査ログシンク
BigQuery Intelligence は、あなたの請求プロジェクトに次のものを作成します。
-
必要な権限でサービスアカウントを更新したときに作成され、サービスアカウントを削除したときに削除される、
doitintl_cmp_bqという名前のデータセット。 -
すべての BigQuery ジョブ向けの、
<Billing_Project_ID>.doitintl_cmp_bq.cloudaudit_googleapis_com_data_accessという名前の監査ログ シンク。
BigQuery Intelligence が実行するクエリ
BigQuery Intelligence は次のプロセスを実行します。
-
テーブル検出プロセス: テーブルのメタデータを収集します。このプロセスはスケジュールで実行され、収集したテーブルのメタデータを
doitintl_cmp_bqデータセット内のtables_discovery_v2というテーブルに書き込みます。 -
コスト更新プロセス: 前時間の BigQuery ジョブを 1 時間あたり 1 回スキャンし、結果を
doitintl_cmp_bqデータセット内のcostsというテーブルに書き込みます。このデータは BigQuery Intelligence のダッシュボードと分析レポートで使用されます。 -
ダッシュボード更新プロセス: BigQuery Intelligence のダッシュボードを更新します。
- コスト削減情報と最適化可能なコストを提供するためのコストシミュレーション クエリを毎日実行します。
- BigQuery の詳細な使用状況を提供するためのインテリジェンス計算クエリを毎日実行します。
-
予約マッピング プロセス: キャパシティ料金モデルを使用している場合、このプロセスは、ジョブが完了した時点で使用中だったエディションとキャパシティ コミットメントをマッピングします。1 時間あたり 1 回実行され、収集したデータを
doitintl_cmp_bqデータセット内の次のテーブルに書き込みます。- 関連付けられたエディションとアロケーション先のプロジェクトを含む予約の一覧を格納する
reservations_mapping_historyテーブル。 - その日にアクティブだったキャパシティ コミットメントに関する情報を格納する
capacity_commitments_historyテーブル。
- 関連付けられたエディションとアロケーション先のプロジェクトを含む予約の一覧を格納する
BigQuery Intelligence のコスト
BigQuery Intelligence は、あなたに代わって doitintl_cmp_bq データセットを作成・管理し、請求プロジェクトでクエリを実行して分析データを提供します。
クエリの実行にかかる実際のコストは、ログのボリュームと選択したコンピュートの料金モデルに依存します。請求プロジェクトが予約に割り当てられている場合、BigQuery Intelligence のジョブは割り当てられた予約のスロットを使用します。
大量の過去ジョブがある場合、サービスアカウントのセットアップ中に過去 30 日間分をバックフィルする際、BigQuery Streaming Inserts のコストが増加する可能性があります。
スロットの自動スケーリング
BigQuery のコンピュート キャパシティはスロットで測定されます。BigQuery のキャパシティを予約する際、BigQuery エディションを有効にし、エディションに関連付けられた予約またはキャパシティ コミットメントを作成できます。
ベースライン スロットと自動スケーリング スロットを備えた予約を使用する場合は、次の点に留意してください。
-
予約に割り当てられたベースライン スロットについては常に課金されます。自動スケーリング スロットは、ベースライン スロット(および該当する場合はアイドル スロット)がすべて消費された後にのみ追加されます。
-
スロット数は常に 50 の倍数でスケールし、1 回のステップで 50 スロットを超えてスケールする場合があります。使用の有無にかかわらず、スケールされたスロット数に対して課金されます。
-
自動スケーリングされたキャパシティは少なくとも 60 秒間(スケールダウンの保持期間)維持されます。
BigQuery のコスト計算では、時間の経過に伴う予約の変更を追跡するためにRESERVATIONS_TIMELINE ビューを使用し、ジョブが完了した時点で使用されていたエディションとコミットメントを特定するために予約マッピング プロセスを実行します。
自動スケーリング中に複数のジョブがある場合、ベースライン スロットを使用したジョブと自動スケーリング スロットを使用したジョブが区別されないため、加重平均に基づき価格を算出します。その結果、全体の合計は概ね正確ですが、個々のジョブや予約のコストが正確でない場合があります。
テーブル タイプの制限事項
BigQuery Intelligence は、BigQuery のクローンとスナップショットのストレージ コストを計算できません。これらのテーブル タイプは、データ共有や親テーブルからの継承に依存する複雑な課金モデルを持っています。BigQuery API で取得できるメタデータでは、ストレージ消費を正確にモデル化するのに十分な情報が提供されません。
ただし、クローンとスナップショットのコストは、Active logical storage や Long-term logical storage などの BigQuery SKU の下にある Google Cloud の請求エクスポートからの集計データには引き続き含まれます。クローンとスナップショットの個別コストの寄与分は 、BigQuery Intelligence のストレージ分析と推奨からのみ除外されます。