Import data via DataHub API
前提条件
すでに DoiT API キー を作成している必要があります。API キーはセキュリティのために GCP Secret Manager に保存できます。
このチュートリアルではデモ目的の擬似データを使用します。実運用では、送信前に必ずデータをサニタイズし、例えば個人を特定できる情報(PII)をマスクしてください。
目的
このチュートリアルでは、次の内容を学びます。
-
DataHub API の JSON ペイロードを使用して、複数のデータセットを DoiT Cloud Analytics(クラウド分析)に取り込む。
-
クラウドの請求データと取り込んだデータを組み合わせて、組織の支出を分析する Cloud Analytics のレポートを作成する。
ステップ 1: データソースを特定
組織の支出は次の要素で構成されます。
-
パブリッククラウドの請求データ: 組織は DoiT から Amazon Web Services と Google Cloud のサービスを購入しています。クラウドの請求データはすでに DoiT Cloud Analytics で利用可能です。
-
サードパーティの費用: 組織はビジネス管理に NetSuite を使用しており、毎月請求されます。
-
運用コスト: 組織には AMER・APAC・EMEA の 3 つのスーパーリージョンに従業員がいます。各地域には複数の機能別チームがあります。従業員コストのデータは CSV ファイルに保存されています。
以下は CSV ファイルの例です。
employees.csv
Employee ID,Employee Name,Territory,Team,Month,Cost
E1001,John Doe,AMER,Exec,2024-03-01,$75000
E1001,John Doe,AMER,Exec,2024-04-01,$75000
E1001,John Doe,AMER,Exec,2024-05-01,$75000
E1002,Jane Smith,AMER,Legal and Finance,2024-03-01,$60000
E1002,Jane Smith,AMER,Legal and Finance,2024-04-01,$60000
E1002,Jane Smith,AMER,Legal and Finance,2024-05-01,$60000
E1003,Emily Davis,AMER,R&D,2024-03-01,$116000
E1003,Emily Davis,AMER,R&D,2024-04-01,$116000
E1003,Emily Davis,AMER,R&D,2024-05-01,$116000
E1004,William Brown,AMER,HR and Support,2024-03-01,$56000
E1004,William Brown,AMER,HR and Support,2024-04-01,$56000
E1004,William Brown,AMER,HR and Support,2024-05-01,$56000
E1005,Xiao Ming,EMEA,R&D,2024-03-01,$61000
E1005,Xiao Ming,EMEA,R&D,2024-04-01,$61000
E1005,Xiao Ming,EMEA,R&D,2024-05-01,$61000
E1006,Ahmed Khan,APAC,R&D,2024-03-01,$58000
E1006,Ahmed Khan,APAC,R&D,2024-04-01,$58000
E1006,Ahmed Khan,APAC,R&D,2024-05-01,$58000
netsuite.csv
Territory,Month,Cost
AMER,2024-03-01,$70000
AMER,2024-04-01,$70000
AMER,2024-05-01,$70000
EMEA,2024-03-01,$7500
EMEA,2024-04-01,$7500
EMEA,2024-05-01,$7500
APAC,2024-03-01,$3700
APAC,2024-04-01,$3700
APAC,2024-05-01,$3700
ステップ 2: データの粒度を定義
全体の支出を分析するには、サードパーティの費用と運用コストを DoiT Cloud Analytics に取り込み、クラウドの請求データと組み合わせる必要があります。
-
NetSuite の費用と従業員コストはそれぞれ個別に取り込み、データソース識別子として
NetSuiteとEmployeesを使用します(Events スキーマのproviderフィールド)。 -
従業員コストのデータについては、DataHub API リクエスト用のペイロードを構築する際に、
Employee ID、Employee Name、Territory、Teamをカスタムディメンション(labelタイプのディメンション)として追加します。