ローカルファイルシステムからデータをロードする
CelerData を使用すると、Stream Load を利用してローカルファイルシステムからデータをロードできます。
Stream Load は HTTPS ベースの同期ロード方法です。ロードジョブを送信すると、CelerData はジョブを同期的に実行し、ジョブが完了した後にその結果を返します。ジョブの結果に基づいて、ジョブが成功したかどうかを判断できます。
Stream Load は、ローカルファイルシステムから 10 GB 未満のデータをロードするのに適しています。
対応フォーマット
対応するファイルフォーマットは CSV と JSON です。
CSV データについては、以下の点に注意してください:
- テキスト区切り文字として、カンマ (,) やタブ、パイプ (|) などの UTF-8 文字列を使用できます。長さは 50 バイトを超えないようにしてください。
- Null 値は
\N
を使用して示します。例えば、データファイルが 3 列で構成されており、そのデータファイルのレコードが第 1 列と第 3 列にデータを持ち、第 2 列にデータがない場合、この状況では第 2 列に\N
を使用して Null 値を示す必要があります。つまり、レコードはa,\N,b
としてコンパイルする必要があり、a,,b
ではいけません。a,,b
はレコードの第 2 列が空の文字列を持っていることを示します。