Amazon Redshiftコネクタ > 部 III: Amazon Redshiftコネクタを使用したデータ統合 > Amazon Redshiftによる同期タスク > 同期タスクのAmazon Redshiftソース
  

同期タスクのAmazon Redshiftソース

Amazon Redshiftソースプロパティは、同期タスクウィザードの[ソース]ページで設定します。
パフォーマンスを最適化するには、[データフィルタ]ページでフィルタを設定します。簡易フィルタまたは詳細フィルタを設定し、ソースの行を削除します。データフローの初期段階でフィルタリングを行うことによって効率を上げることができます。簡易フィルタには、フィールド名、演算子、値が含まれます。 詳細フィルタを使用するとより複合フィルタ条件を定義できます。例えば、AND論理演算子またはOR論理演算子を使用して、複数の条件を組み込むことができます。
次の表に、Amazon Redshiftのソースプロパティを示します。
プロパティ
説明
接続
ソース接続の名前。
ソースタイプ
ソースオブジェクトのタイプ単一または複数を選択します。
ソースオブジェクト
ソースオブジェクトの名前。単一のソースまたは複数の関連するソースのソースオブジェクトを選択します。
Amazon Redshiftソースを使用するように同期タスクを設定するときに、詳細ソースプロパティを設定できます。詳細ソースプロパティは、同期タスクウィザードの[スケジュール]ページに表示されます。
次の表に、Amazon Redshiftの詳細なソースプロパティを示します。
詳細プロパティ
説明
S3バケット名
Amazon RedshiftソースデータのAmazon S3バケット名。
Amazon Redshiftクラスタと同じリージョンでS3バケットを使用します。
圧縮を有効にする
ファイルをAmazon Redshiftに書き込む前に、ステージングファイルを圧縮します。
Secure Agentがステージングファイルを圧縮すると、タスクのパフォーマンスが向上します。
デフォルトではオンに設定されています。
ステージングディレクトリの場所
Amazon Redshiftのステージングディレクトリ。
Secure Agentランタイム環境でタスクを実行する場合は、ランタイム環境内の各Secure Agentマシンで利用できるディレクトリパスを指定します。
Hosted Agentのランタイム環境でタスクを実行する場合は、ステージングディレクトリの場所を空のままにしてください。Hosted Agentは、一時的な場所にディレクトリを作成します。
UnloadOptionsプロパティファイル
Unloadコマンドのオプション。
Amazon RedshiftオブジェクトからS3バケットにデータを書き込むためには、Unloadコマンドにオプションを追加します。次のオプションを追加できます。
  • - DELIMITER
  • - PARALLEL
  • - ESCAPE
  • - AWS_IAM_ROLE
Secure Agentのランタイム環境でタスクを実行するときは、アンロードオプションを含むプロパティファイルのパスを指定するか、[UnloadOptionsプロパティファイル]フィールドで直接アンロードオプションを指定します。
Hosted Agentランタイム環境でタスクを実行するときは、[UnloadOptionsプロパティファイル]フィールドで直接オプションを指定します。
S3クライアントサイドの暗号化の有効化
Secure Agentがプライベート暗号化キーを使用してデータを暗号化することを示します。
暗号化タイプ
ソースの暗号化タイプを選択します。以下の暗号化タイプから選択できます。
  • - SSE-S3
  • - SSE-KMS
デフォルトはSSE-S3です。詳細については、Amazon Redshiftソースのデータ暗号化を参照してください。
S3ファイルの分割ダウンロードの有効化
大きなAmazon S3オブジェクトを複数パーツに分けてダウンロードします。
Amazon S3オブジェクトのファイルサイズが5MBを超える場合は、オブジェクトを複数パーツに分けて同時にダウンロードできます。
パーツサイズ
オブジェクトのパーツサイズを指定します。デフォルトは5MBです。
Infa詳細フィルタ
Amazon Redshiftコネクタには適用されません。
Pre-SQL
Amazon Redshiftからデータを読み取る前にクエリを実行するためのPre-SQLコマンド。UNLOADコマンドまたはCOPYコマンドを使用することもできます。ここで指定するコマンドは、プレーンテキストとして処理されます。
Post-SQL
Amazon Redshiftにデータを書き込んだ後にクエリを実行するためのPost-SQLコマンド。UNLOADコマンドまたはCOPYコマンドを使用することもできます。ここで指定するコマンドは、プレーンテキストとして処理されます。
SQL クエリ
デフォルトクエリーを上書きします。カラム名を二重引用符で囲みます。SQLクエリでは大文字と小文字が区別されます。Amazon RedshiftデータベースでサポートされているSQL文を指定します。
Number of Sorted Ports
クエリが行われたソースの行をソートする場合に使用されるカラム数。エージェントでは、ソース行を読み込む際にデフォルトのクエリにORDER BY句が追加されます。ORDER BY句には、指定された数のポートが、トランスフォーメーションの最初のポートから順に取り込まれます。ソートするポート数を指定する場合、データベースのソート順は、セッションのソート順に一致しなければなりません。
デフォルトは 0 です。
個別選択
一意の値を選択します。このオプションを選択すると、エージェントにSELECT DISTINCT文が含まれます。Amazon Redshiftは末尾のスペースを無視します。したがって、予期されるより少ない行がエージェントで抽出される可能性があります。
ソーステーブル名
デフォルトのソーステーブル名を上書きできます。