Amazon Redshiftコネクタ > 部 III: Amazon Redshiftコネクタを使用したデータ統合 > Amazon Redshiftによる同期タスク > 同期タスクのAmazon Redshiftターゲット
  

同期タスクのAmazon Redshiftターゲット

同期タスクのターゲットとしてAmazon Redshiftオブジェクトを使用できます。
Amazon Redshiftターゲットオブジェクトを使用する場合は、標準オブジェクトをプライマリソースとして選択できます。
Amazon Redshiftターゲットプロパティは、同期タスクウィザードの[ターゲット]ページで設定します。
次の表に、Amazon Redshiftターゲットプロパティを示します。
プロパティ
説明
接続
ターゲット接続の名前。
ターゲットオブジェクト
ターゲットオブジェクトの名前。プライマリターゲットオブジェクトを選択します。
ターゲットの作成
ターゲットを作成します。
ターゲットオブジェクトの名前を入力して、使用するソースフィールドを選択します。デフォルト名はソースオブジェクトの名前です。また、デフォルトではすべてのソースフィールドが使用されます。必要に応じて、ターゲットオブジェクトのファイル拡張子を入力します。
Amazon Redshiftターゲットを使用するように同期タスクを設定するときに、詳細ターゲットプロパティを設定できます。
次の表に、Amazon Redshiftの詳細ターゲットプロパティを示します。
プロパティ
説明
S3バケット名
Amazon RedshiftターゲットデータのAmazon S3バケット名。
Amazon Redshiftクラスタと同じリージョンでS3バケットを使用します。
圧縮を有効にする
ファイルをAmazon Redshiftに書き込む前に、ステージングファイルを圧縮します。
Secure Agentでステージングファイルを圧縮するときに同期タスクのパフォーマンスが向上します。
デフォルトではオンに設定されています。
ステージングディレクトリの場所
Amazon Redshiftのステージングディレクトリ。
Secure Agentランタイム環境でタスクを実行する場合は、ランタイム環境内の各Secure Agentマシンで利用できるディレクトリパスを指定します。
Hosted Agentのランタイム環境でタスクを実行する場合は、ステージングディレクトリを空のままにしてください。Hosted Agentは、一時的な場所にディレクトリを作成します。
バッチサイズ
バッチ内の最小行数。0より大きい値を入力します。
デフォルトは2000000です。
INSERT用のアップロードバッチごとの最大Redshiftエラー数
バッチの失敗の原因となるバッチ内のエラーの数。正の整数値を入力します。
エラー数がプロパティ値以上になると、Secure Agentはバッチ全体をエラー行ファイルに書き込みます。
デフォルトは1です。
データロード前にターゲットテーブルをトランケート
データをターゲットに書き込む前に、Amazon Redshiftターゲットをトランケートします。
CHARデータ型およびVARCHARデータ型のNULL値
Amazon RedshiftターゲットのCHARおよびVARCHARフィールドのNULL値を表すために使用される文字列値(NULL、スペース文字など)。
デフォルトは空の文字列です。
S3でのファイル整合性のための待ち時間(秒)
Secure Agentでステージングファイルを使用できるようになるまでの待ち時間(秒)。
デフォルトは5です。
CopyOptionsプロパティファイル
Copyコマンドのオプション。
Amazon S3バケットからAmazon Redshiftターゲットにデータを書き込むためには、Copyコマンドにオプションを追加します。次のオプションを追加できます。
  • - DELIMITER
  • - ACCEPTINVCHARS
  • - QUOTE
  • - COMPUPDATE
  • - AWS_IAM_ROLE
Secure Agentランタイム環境でタスクを実行するときは、コピーオプションを含むプロパティのパスを指定するか、[CopyOptionsプロパティファイル]フィールドで直接コピーオプションを指定します。
Hosted Agentランタイム環境でタスクを実行するときは、[CopyOptionsプロパティファイル]フィールドで直接オプションを指定する必要があります。
S3サーバーサイドの暗号化の有効化
Amazon S3がアップロードおよびアクセス時にデータを暗号化および復号化することを示します。
S3クライアントサイドの暗号化の有効化
Secure Agentがプライベート暗号化キーを使用してデータを暗号化することを示します。
サーバーサイドとクライアントサイドの両方で暗号化を有効にすると、ランタイム環境はサーバーサイドの暗号化を無視します。
ターゲットテーブルのクリーンアップ
ディスク領域を回復し、指定したテーブルまたはデータベース内のすべてのテーブルの行をソートします。
次のリカバリオプションを選択できます。
  • - なし
  • - 全体
  • - ソートのみ
  • - 削除のみ
  • - 再インデックス
デフォルトは[なし]です。
ターゲットテーブルの分析
読み取りおよび書き込み操作の効率が向上します。
Amazon Redshiftのクエリプランナーは、統計メタデータを更新して、クエリ効率の向上に最適な計画を作成して選択します。
S3でステージングファイルを保持するためのプレフィックス
Amazon S3でステージングファイルを保持します。
Amazon S3 でステージングファイルを保持するには、ディレクトリプレフィックスとファイルプレフィックスの両方をスラッシュ(/)で区切って指定するか、ファイルプレフィックスのみを指定します。例えば、backup_dir/backup_filebackup_fileです。
Pre-SQL
Amazon Redshiftからデータを読み取る前にクエリを実行するためのPre-SQLコマンド。UNLOADコマンドまたはCOPYコマンドを使用することもできます。ここで指定するコマンドは、プレーンテキストとして処理されます。
Post-SQL
Amazon Redshiftにデータを書き込んだ後にクエリを実行するためのPost-SQLコマンド。UNLOADコマンドまたはCOPYコマンドを使用することもできます。ここで指定するコマンドは、プレーンテキストとして処理されます。
ターゲットテーブル名
デフォルトのターゲットテーブル名を上書きできます。
パーツサイズ
オブジェクトのパーツサイズを指定します。
デフォルトは5MBです。
TransferManagerスレッドプールサイズ
データを並行して書き込むスレッドの数を指定します。
デフォルトは10です。
バッチごとのファイル数
バッチごとにターゲットステージングファイル数を計算するためのファイル数を指定します。
値を指定しない場合、ターゲットステージングファイル数は内部的に計算されます。
注: クラスタタイプとAmazonRedshiftクラスタ内のノード数に基づいて最小値を指定します。エラーを回避するには、1500未満の値を指定します。
成功ファイルディレクトリ
Amazon Redshiftの成功行ファイルのディレクトリ。各Secure Agentマシンのランタイム環境で使用可能なディレクトリパスを指定します。デフォルトでは、データ統合は成功ファイルをディレクトリ<Secure Agent installation directory>/apps/Data_Integration_Server/data/successに書き込みます。
Hosted Agentは成功行ファイルを作成しません。Hosted Agentランタイム環境でタスクを実行するときは[成功ファイルディレクトリ]フィールドを空白のままにします。
エラーファイルのディレクトリ
エラー行ファイルのディレクトリ。各Secure Agentマシンのランタイム環境で使用可能なディレクトリパスを指定します。デフォルトでは、データ統合はエラー行ファイルをディレクトリ<Secure Agent installation directory>/apps/Data_Integration_Server/data/errorに書き込みます。
デフォルトのエラーファイルディレクトリを指定するとき、[スケジュール]タブからエラーファイルをダウンロードすることができます。
エラーファイルディレクトリがデフォルトのエラーディレクトリ以外の場合、[スケジュール]タブからエラーファイルをダウンロードすることはできません。エラーファイルを見付けるには、指定されたディレクトリに移動する必要があります。
Hosted Agentはエラー行ファイルを作成しません。Hosted Agentランタイム環境でタスクを実行するときは[エラーファイルディレクトリ]フィールドを空白のままにします。