GCP へのデプロイ
CelerData は、GCP 上にクラシックまたはエラスティッククラスタを簡単にデプロイするためのユーザーフレンドリーなデプロイメントウィザードを提供しています。このプロセスは4つの簡単なステップに分かれています。
- STEP1: クラスタリソースの設定
- STEP2: GCP のクレデンシャルを設定
- STEP3: クラスタへのアクセスを設定
- STEP4: GCP クラウド上にクラスタをデプロイ
CelerData は、各 BE がそのストレージにデータの一部を持つクラシック共有なしクラスタと、すべてのデータが共有オブジェクトストレージにあり、キャッシュのみがコンピュートノード (CN) にローカルであるエラスティック共有データクラスタをサポートしています。エラスティッククラスタでは、CN が BE を置き換えます。
エラスティッククラスタに関する詳細は warehouse overview にあります。
デプロイメントウィザードを開始する
デプロイメントウィザードを開始するには、次の手順に従ってください。
- CelerData Cloud BYOC コンソール にサインインします。
- Clusters ページで、Create cluster をクリックします。
- 表示されるダイアログボックスで、Classic cluster または Elastic cluster を選択し、クラウドプロバイダーとして GCP を選択してから Next をクリックします。
NOTE
GCP では、CelerData は手動デプロイメントのみをサポートしています。
手動デプロイメントの設定と実行
次のクレデンシャルと設定を作成する前に、Google Cloud Project を作成し、必要な API を有効にする 必要があります。
デプロイメントを成功させるためには、データクレデンシャル、デプロイメントクレデンシャル、ネットワーク設定を提供する必要があります。
-
データクレデンシャル
データクレデンシャルは、クエリプロファイルを保存するために使用される Cloud Storage バケットへの読み取りおよび書き込み権限を宣言します。詳細は Manage data credentials for GCP を参照してください。
-
デプロイメントクレデンシャル
デプロイメントクレデンシャルは、CelerData のパブリックサービスアカウントを参照し、GCP プロジェクトでクラウドリソースを起動および管理するために必要な権限を付与します。これにより、CelerData はデプロイメントに必要なリソースを起動し、スケーリングを続行できます。詳細は Manage deployment credentials for GCP を参照してください。
-
ネットワーク設定
ネットワーク設定は、独自の VPC 内のクラスタノード間および CelerData の VPC と独自の VPC 間の接続を可能にします。詳細は Manage network configurations for GCP を参照してください。
デプロイメントウィザードを開始した後(前述のセクション "Start the deployment wizard" で説明されています)、デプロイメントのための 4 つの必須ステップ (STEP1 から STEP4) が案内されます。
STEP1: クラスタリソースの設定
ビジネス要件に基づいてクラスタを設定し、必要に応じて Add label をクリックしてクラスタに 1 つ以上のラベルを追加します。その後、Next をクリックして続行します。ここで追加したラベルは、クラスタに関連付けられた GCP クラウドリソースに添付されます。
NOTE
- CelerData は Free Developer Tier を提供しています。これを使用するには、4 CPU コアと 16-GB RAM を提供する FE および BE インスタンスタイプを選択する必要があります。
- 4 CPU コアと 16-GB RAM は、FE および BE の最小構成パッケージでもあります。
-
クラシッククラスタの場合、次の設定項目を設定します。
Parameter Required Description Cluster name Yes クラスタの名前を入力します。クラスタが作成された後、名前は変更できません。後でクラスタを簡単に識別できるような情報豊富な名前を入力することをお勧めします。 GCP region Yes クラスタをホストする GCP リージョンを選択します。CelerData がサポートするリージョンについては、Supported cloud platforms and regions を参照してください。 FE HA mode No FE HA モードを有効または無効にします。FE HA モードはデフォルトで無効になっています。 - FE HA モードが無効の場合、1 つの FE のみがデプロイされます。この設定は、CelerData がどのように役立つかを学ぶための概念実証クラスタを作成する場合や、テスト目的で小さなクラスタを作成する場合に推奨されます。
- FE HA モードが有効の場合、3 つの FE がデプロイされます。この設定は、プロダクション環境向けのクラスタを作成する場合に推奨されます。3 つの FE があることで、クラスタはより多くの高並列クエリを処理しながら高可用性を確保できます。
FE instance type Yes クラスタ内の FE ノードのインスタンスタイプを選択します。CelerData がサポートするインスタンスタイプについては、Supported instance types を参照してください。 BE instance type Yes クラスタ内の BE ノー ドのインスタンスタイプを選択します。CelerData がサポートするインスタンスタイプについては、Supported instance types を参照してください。 BE storage size Yes クラスタ内の各 BE ノードが提供するストレージ容量を指定します。 BE node count Yes クラスタにデプロイする BE ノードの数を指定します。処理するデータ量に基づいて BE の数を決定できます。デフォルト値は 3 です。CelerData は各テーブルを 3 つの異なる BE に 3 つのレプリカとして保存する必要があります。 -
エラスティッククラスタの場合、次の設定項目を設定します。
Parameter Required Description Cluster name Yes クラスタの名前を入力します。クラスタが作成された後、名前は変更できません。後でクラスタを簡単に識別できるような情報豊富な名前を入力することをお勧めします。 GCP region Yes クラスタをホストする GCP リージョンを選択します。CelerData がサポートするリージョンについては、Supported cloud platforms and regions を参照してください。 Coordinator HA mode No コーディネータ HA モードを有効または無効にします。コーディネータ HA モー ドはデフォルトで無効になっています。 - コーディネータ HA モードが無効の場合、1 つのコーディネータのみがデプロイされます。この設定は、CelerData がどのように役立つかを学ぶための概念実証クラスタを作成する場合や、テスト目的で小さなクラスタを作成する場合に推奨されます。
- コーディネータ HA モードが有効の場合、3 つのコーディネータがデプロイされます。この設定は、プロダクション環境向けのクラスタを作成する場合に推奨されます。3 つのコーディネータがあることで、クラスタはより多くの高並列クエリを処理しながら高可用性を確保できます。
Coordinator node size Yes クラスタ内のコーディネータノードのインスタンスタイプを選択します。CelerData がサポートするインスタンスタイプについては、Supported instance types を参照してください。 Compute node size Yes クラスタ内のデフォルトウェアハウスのコンピュートノードのインスタンスタイプを選択します。CelerData がサポートするインスタンスタイプについては、Supported instance types を参照してください。 Compute storage size No デフォルトウェアハウスのコンピュートノードのストレージサイズを指定します。このフィールドの横にあるボックスにチェックを入れることで、ボリュームの数をカスタマイズすることもできます。このフィールドは Hyperdisk バックのインスタンスタイプにのみ利用可能です。 Compute node count Yes クラスタ内のデフォルトウェアハウスのコンピュートノードの数を指定します。処理するデータ量に基づいてコンピュートノードの数を決定できます。デフォルト値は 1 です。 Advance Settings では、クラシッククラスタの FE および BE ノードまたはエラスティッククラスタのコーディネータノードのストレージ自動スケーリングポリシーをさらに定義できます。ビジネスのワークロードが予測不可能で、クラスタ作成時に固定数のストレージボリュームを割り当てることができない場合は、CelerData クラスタのノードに対してストレージ自動スケーリングを有効にすることができます。この機能を有効にすると、CelerData は事前設定されたストレージスペースが不足していることを検出したときに自動的にストレージサイズを拡大します。
次の手順に従ってください。
-
FE storage、BE storage、または Coordinator Storage の後にあるスイッチをオンにして、それぞれのストレージ自動スケーリングを有効にします。
-
自動スケーリング操作をトリガーするストレージ使用率のしきい値(パーセンテージ)を設定します。このしきい値は 80% から 90% の間で設定できます。ノードのストレージ使用率がこのしきい値に達し、5 分以上続いた場合、CelerData は以下の手順で定義したステップサイズでストレージを拡大します。
-
各自動スケーリング操作のステップサイズを設定します。ステップサイズを固定サイズ(GB)またはパーセンテージで設定することができます。例えば、50 GB または 15%(元のストレージサイズの)です。
-
各ノードの最大ストレージサイズを設定します。CelerData は、ストレージサイズがこのしきい値に達したときにストレージの拡大を停止します。
NOTE
- 2 回のスケーリング操作(手動スケーリングと自動スケーリングを含む)の間隔として、最低 6 時間が必須です。
- 各ストレージの最大サイズは 64 TB です。
- エラスティッククラスタのコンピュートノードは自動スケーリングをサポートしていません。
STEP2: GCP のクレデンシャルを設定
このステップでは、新しいデータクレデンシャルと新しいデプロイメントクレデンシャルを作成するか、以前の成功したデプロイメント時に CelerData によって自動的に作成された既存のものを選択する必要があります。設定を完了したら、Next をクリックして続行します。
CelerData を初めて使用する場合は、新しいデータクレデンシャルと新しいデプロイメントクレデンシャルを作成することをお勧めします。
新しいクレデンシャル を作成することを選択する
新しいクレデンシャルを作成する前に、Google Cloud Project を作成し、必要な API を有効にする 必要があります。
次の図に示すように、No, I need to manually create new credentials from scratch を選択します。その後、データクレデンシャルとデプロイメントクレデンシャルを作成します。