Databricks を接続
このページでは、DoiT コンソールから Databricks アカウントを接続および管理する方法を説明します。接続後は、DoiT コンソール内で Databricks の使用状況とコストデータを使用できます。詳しくは、Databricks データの利用を参照してください。
以下のコンテンツを読むか、ビジュアルで確認できる▶️ インタラクティブ デモをご覧ください。
開始する前に
DoiT と Databricks を統合するには、次が必要です。
-
Databricks の Account Admin かつ metastore admin であること。
-
Databricks の warehouse が Unity catalog に対応していること。
-
自身のワークロードで Databricks SQL を使用していなくても、この統合には SQL warehouse が必要です。DoiT は、システムテーブルに対して日に複数回クエリを実行するためのコンピュート エンドポイントとして使用します。
-
既に利用可能な warehouse(自動作成される Serverless Starter Warehouse を含む)がある場合はそれを使用できます。
-
ない場合は、ワークロード分離とコスト予測性を高めるために、小さな専用の Classic SQL warehouse を作成してください。以下の設定を推奨します。
- タイプ: Classic
- クラスタサイズ: 2X-small
- 自動停止: 5 分
-
必要な権限
Databricks アカウントを DoiT に接続するには、DoiT アカウントに Billing Profiles Admin 権限が必要です。
Databricks アカウントを接続
1 つ以上の Databricks アカウントを接続できます。接続したい各アカウントについて、接続手順を繰り返してください。
Databricks アカウントの接続を支援するため、DoiT コンソールではステップごとのウィザードを複数の方法で起動できます。
-
次にナビゲート:Home ページに移動し、下にスクロールして クラウドを接続 セクションで Databricks アカウントを接続 を選択。
-
次にナビゲート:Assets ページに移動。 左側メニューで Databricks を選択し、新しいアカウントを接続 を選択。
-
次にナビゲート:Databricks Intelligence ダッシュボードに移動し、Databricks を接続 を選択。
ウィザードは 3 つのステップで構成されています。

アカウントを設定
Databricks と統合する際は、Databricks アカウントの詳細を入力する必要があります。
-
Databricks Workspace UI に Account Admin としてサインインします。
-
Account Settings に移動し、Databricks のアカウント名をコピーします。
-
DoiT コンソールで Account name に Databricks のアカウント名を入力します。
-
次へ を選択して認証情報を設定します。

認証情報を設定
DoiT がプログラム的に Databricks にアクセスできるようにするため、Databricks アカウントごとに 1 つの Databricks サービス プリンシパルを作成し、シークレットを生成する必要があります。認証情報の設定は 4 つのパートで構成されます。
-
Databricks サービス プリンシパルを作成し、シークレットを生成します。
-
サービス プリンシパルにアクセス権を付与し、DoiT と統合する Databricks warehouse へのアクセスを許可します。
-
サービス プリンシパルに対して Databricks SQL access のエンタイトルメントを有効化 します。
-
サービス プリンシパルのシークレットを提供し、DoiT ウィザードに入力します。
サービス プリンシパルを作成
DoiT が Databricks 環境にアクセスできるよう、専用の Databricks サービス プリンシパルを作成し、シークレットを生成します。
-
Databricks Workspace UI にサインインします。
-
User Management を選択します。
-
Service principals タブで Add service principal を選択します。
-
サービス プリンシパルの名前を入力し、Add を選択します。サービス プリンシパルが作成済みになります。
-
Credentials & secrets タブで シークレットを生成 を選択します。Generate OAuth secret ペインが表示されます。
-
Lifetime (days) に 730 と入力し、生成 を選択します。
注意DoiT と Databricks の継続的な接続期間を最大化するため、サービス プリンシパルのシークレットの有効期間は 730 日を推奨します。ただし、組織のセキュリティ ポリシーに合わせて設定できます。Databricks アカウントを接続後 は、DoiT ウィザードから Databricks サービス プリンシパルのシークレットを更新できます。
-
シークレットと クライアント ID の両方をコピーします。
注意シークレットは一度しか表示されません。ブラウザウィンドウを閉じる前に必ずシークレットをコピーしてください。
-
完了 を選択して Generate OAuth secret ペインを閉じます。
サービス プリンシパルに warehouse アクセスを付与
上で作成したサービス プリンシパルに、DoiT と統合したい Databricks warehouse へのアクセス権を付与する必要があります。
-
Databricks Workspace UI で Workspaces を選択します。
-
DoiT に接続したいワークスペースを見つけ、ワークスペース行の最右端にあるケバブメニュー(⋮)から Update を選択します。
注意ワークスペースでは billing と compute のスキーマが有効になっている必要があります。
-
Permissions タブで 権限を追加 を選択します。Add permissions ペインが表示されます。
-
User, group, or service principal で、上で作成したサービス プリンシパルを検索して選択します。
-
Permission で User が選択されていることを確認し、保存 を選択します。
-
Configuration タブを選択し、Open workspace を選択します。
-
SQL editor を選択します。
-
次をコピーして New query タブに貼り付けます。
GRANT USE CATALOG ON CATALOG system TO `<client_id>`;
GRANT USE SCHEMA ON SCHEMA system.access TO `<client_id>`;
GRANT SELECT ON TABLE system.access.workspaces_latest TO `<client_id>`;
GRANT USE SCHEMA ON SCHEMA system.billing TO `<client_id>`;
GRANT SELECT ON TABLE system.billing.usage TO `<client_id>`;
GRANT SELECT ON TABLE system.billing.list_prices TO `<client_id>`;
GRANT USE SCHEMA ON SCHEMA system.compute TO `<client_id>`;
GRANT SELECT ON TABLE system.compute.clusters TO `<client_id>`;
GRANT SELECT ON TABLE system.compute.node_timeline TO `<client_id>`;
GRANT SELECT ON TABLE system.compute.warehouses TO `<client_id>`;client_idを、上で作成したサービス プリンシパルの ID に置き換えます。 -
ステートメントを実行します。
-
DoiT と統合したい各 warehouse について、これらの手順を繰り返します。
サービス プリンシパルの Databricks SQL access
上で作成したサービス プリンシパルに対して Databricks SQL access のエンタイトルメントを有効にする必要があります。
-
Databricks Workspace UI で、Databricks ワークスペース上部の自分のユーザー名を選択し、Settings を選択します。
-
Identity and access タブを選択します。
-
Service principals から 管理 を選択します。
-
対象のサービス プリンシパルを選択して詳細ページを開きます。
-
Configurations タブを選択し、Databricks SQL access のエンタイトルメントを選択します。
-
更新 を選択します。DoiT コンソールに戻り、サービス プリンシパルのクライアント ID とシークレットを DoiT ウィザードに追加します。
サービス プリンシパルのシークレットを提供
Databricks のサービス プリンシパルを作成しシークレットを生成したら、DoiT ウィザードに追加する必要があります。
-
DoiT コンソールに移動し、上で作成したサービス プリンシパルの クライアント ID とシークレットを貼り付けます。
-
次へ を選択して warehouse を追加します。

ウエアハウスを追加
Databricks ウェアハウスは、Databricks ワークスペースに保存されたデータに対して SQL クエリを実行できる SQL ウェアハウスです。Databricks をインテグレーションするには、Databricks アカウントに属するウェアハウスを少なくとも 1 つ追加する必要があります。
複数のワークスペースからウェアハウスを接続できますが、これはワークスペースが複数の AWS リージョンに分散している場合にのみ必要です。その場合、各リージョンでウェアハウスを接続することで、より包括的なクラスタ利用状況レポートが可能になります。Databricks の請求データはアカウントレベルであり、すべてのワークスペースを対象とするため、ワークスペース数に関係なく、請求の全体をカバーするには単一のウェアハウスで十分です。
Databricks アカウントの接続が完了したら、DoiT コンソールの アセット ページから新しいウェアハウスを追加できます。
-
ウエアハウスを追加 を選択してください。
-
ウェアハウス ID に、ウェアハウス ID を入力してください。
ウェアハウス ID を確認するには、Databricks Workspace UI にサインインし、SQL warehouses に移動して、対象のウェアハウス名を選択して詳細ページを開いてください。
-
サーバーホスト名 に、ウェアハウスが属する Databricks ワークスペースのサーバーホスト名を入力してください。
サーバーホスト名を確認するには、Databricks Workspace UI にサインインし、SQL warehouses に移動して、対象のウェアハウス名を選択して詳細ページを開いてください。Connection details タブを選択し、Server hostname からサーバーホスト名をコピーしてください。

-
接続テスト を選択してください。テストが成功したら、追加 を選択してください。
-
追加したい各ウェアハウスについて、これらの手順を繰り返してください。
-
すべてのウェアハウスを追加したら、完了 を選択してください。
初回の接続時に、DoiT は追加された各ウェアハウスの過去6か月の請求および使用状況データを取り込みます。
Databricks アカウントの接続に成功すると、Databricks の請求および使用状況データの取り込みを開始します。処理には数時間かかる場合があります。各ウェアハウスのデータが Cloud Analytics およびその他の DoiT 機能で利用可能になった際には、メールでお知らせします。
Databricks を管理
このページでは、DoiT コンソールで Databricks アカウントを管理する方法(ウェアハウスの追加や、DoiT プラットフォームからの Databricks アカウントの削除を含む)を説明します。
新しい Databricks ウェアハウスを接続
DoiT とインテグレーション済みの Databricks アカウントに対して、新しい Databricks ウェアハウスを接続できます。
-
DoiT コンソール にサインインし、上部ナビゲーションのメガメニューから データ取り込みとインテグレーション を選択し、アセット を選択してください。
-
左側のメニューから Databricks を選択してください。
-
ウェアハウスを接続 を選択してください。
-
アカウント名 で、新しいウェアハウスを接続したい Databricks アカウントを選択してください。
-
ウェアハウス ID に、ウェアハウス ID を入力してください。
ウェアハウス ID を確認するには、Databricks Workspace UI にサインインし、SQL warehouses に移動して、対象のウェアハウス名を選択して詳細ページを開いてください。
-
サーバーホスト名 に、ウェアハウスが属する Databricks ワークスペースのサーバーホスト名を入力してください。
サーバーホスト名を確認するには、Databricks Workspace UI にサインインし、SQL warehouses に移動して、対象のウェアハウス名を選択して詳細ページを開いてください。Connection details タブを選択し、Server hostname からサーバーホスト名をコピーしてください。
-
接続テスト を選択してください。テストが成功したら、追加 を選択してください。
-
すべてのウェアハウスを追加したら、完了 を選択してください。Databricks ウェアハウスの接続に成功すると、Databricks の請求および使用状況データの取り込みを開始します。処理には数時間かかる場合があります。ウェアハウスのデータが Cloud Analytics およびその他の DoiT 機能で利用可能になった際には、メールでお知らせします。
Databricks アカウントの削除
Databricks ウェアハウスを削除することで、DoiT コンソールから Databricks のコストおよび使用状況データを削除できます。
-
DoiT コンソール にサインインし、上部ナビゲーションのメガメニューから データ取り込みとインテグレーション を選択し、アセット を選択してください。
-
左側のメニューから Databricks を選択してください。
-
データを削除したい Databricks アカウントを選択してください。
-
削除したい Databricks アカウントの最右端にあるケバブメニュー(⋮)を選択し、ウェアハウスを削除 を選択してください。

-
削除 を選択して、DoiT から Databricks アカウントを削除してください。
▶️インタラクティブデモ
操作しながら学べるインタラクティブデモをお試しください。
デモが正しく表示されない場合は、ブラウザウィンドウを拡大するか、新しいタブでデモを開く ことをお試しください。