Amazon Redshiftコネクタ > 部 III: Amazon Redshiftコネクタを使用したデータ統合 > Amazon Redshiftによるマッピングとマッピングタスク > マッピングのAmazon Redshiftソース

マッピングのAmazon Redshiftソース

マッピングでは、ソーストランスフォーメーションを設定して単一のAmazon Redshiftソースまたは複数のAmazon Redshiftソースを表すことができます。

Amazon Redshift標準オブジェクトをソースとして使用できます。標準オブジェクトをプライマリソースとして選択してから、1つ以上の子オブジェクトを追加することができます。

以下の表に、ソーストランスフォーメーションで設定できるAmazon Redshiftソースプロパティを示します。

プロパティ	説明
接続	ソース接続の名前。
ソースタイプ	ソースオブジェクトのタイプ［単一オブジェクト］、［複数のオブジェクト］、［クエリ］、または［パラメータ］を選択します。
オブジェクト	ソースオブジェクトの名前。ソースごとにソースオブジェクトを選択します。

以下の表に、ソーストランスフォーメーションで設定できるAmazon Redshiftクエリオプションを示します。

プロパティ

説明

Filter

読み取り操作で値をフィルタ処理します。［設定］をクリックして、条件を追加してレコードをフィルタ処理し、Secure Agentがソースから読み取る行数を縮小します。

指定できるフィルタ条件を次に示します。

- パラメータを使用しません。基本フィルタを使用して、オブジェクト、フィールド、演算子、および値を指定して特定のレコードを選択します。
- すべてパラメータを使用します。パラメータを使用してフィールドマッピングを表現します。
- 詳細。詳細フィルタを使用して、Amazon Redshiftクエリ形式を使用するさらに複合的なフィルタ条件を定義します。

ソート

該当なし。

以下の表に、ソーストランスフォーメーションで設定できるAmazon Redshiftソースの詳細プロパティを示します。

詳細プロパティ	説明
S3バケット名	Amazon RedshiftターゲットデータのAmazon S3バケット名。 Amazon Redshiftクラスタと同じリージョンでS3バケットを使用します。
圧縮を有効にする	ファイルをAmazon Redshiftに書き込む前に、ステージングファイルを圧縮します。ランタイム環境でステージングファイルを圧縮するときにタスクパフォーマンスが向上します。デフォルトではオンに設定されています。
ステージングディレクトリの場所	Amazon Redshiftのステージングディレクトリ。 Secure Agentランタイム環境でタスクを実行する場合は、ランタイム環境内の各Secure Agentマシンで利用できるディレクトリパスを指定します。 Hosted Agentのランタイム環境でタスクを実行する場合は、ステージングディレクトリを空のままにしてください。Hosted Agentは、一時的な場所にディレクトリを作成します。
UnloadOptionsプロパティファイル	Unloadコマンドのオプション。 Amazon RedshiftオブジェクトからS3バケットにデータを書き込むためには、Unloadコマンドにオプションを追加します。次のオプションを追加できます。 - DELIMITER - PARALLEL - ESCAPE - AWS_IAM_ROLE Secure Agentのランタイム環境でタスクを実行するときは、アンロードオプションを含むプロパティファイルのパスを指定するか、［UnloadOptionsプロパティファイル］フィールドで直接アンロードオプションを指定します。 Hosted Agentランタイム環境でタスクを実行するときは、［UnloadOptionsプロパティファイル］フィールドで直接オプションを指定します。
S3クライアントサイドの暗号化の有効化	Secure Agentがプライベート暗号化キーを使用してデータを暗号化することを示します。
暗号化タイプ	ソースの暗号化タイプを選択します。以下の暗号化タイプから選択できます。 - SSE-S3 - SSE-KMS デフォルトはSSE-S3です。
S3ファイルの分割ダウンロードの有効化	大きなAmazon S3オブジェクトを複数パーツに分けてダウンロードします。 Amazon S3オブジェクトのファイルサイズが5MBを超える場合は、オブジェクトを複数パーツに分けて同時にダウンロードできます。
パーツサイズ	オブジェクトのパーツサイズを指定します。デフォルトは5MBです。
Infa詳細フィルタ	Amazon Redshiftコネクタには適用されません。
Pre-SQL	Amazon Redshiftからデータを読み取る前にクエリを実行するためのPre-SQLコマンド。UNLOADコマンドまたはCOPYコマンドを使用することもできます。ここで指定するコマンドは、プレーンテキストとして処理されます。
Post-SQL	Amazon Redshiftにデータを書き込んだ後にクエリを実行するためのPost-SQLコマンド。UNLOADコマンドまたはCOPYコマンドを使用することもできます。ここで指定するコマンドは、プレーンテキストとして処理されます。
SQL クエリ	デフォルトクエリーを上書きします。カラム名を二重引用符で囲みます。SQLクエリでは大文字と小文字が区別されます。Amazon RedshiftデータベースでサポートされているSQL文を指定します。
Number of Sorted Ports	クエリが行われたソースの行をソートする場合に使用されるカラム数。エージェントでは、ソース行を読み込む際にデフォルトのクエリにORDER BY句が追加されます。ORDER BY句には、指定された数のポートが、トランスフォーメーションの最初のポートから順に取り込まれます。ソートするポート数を指定する場合、データベースのソート順は、セッションのソート順に一致しなければなりません。デフォルトは 0 です。
個別選択	一意の値を選択します。このオプションを選択すると、エージェントにSELECT DISTINCT文が含まれます。Amazon Redshiftは末尾のスペースを無視します。したがって、予期されるより少ない行がエージェントで抽出される可能性があります。
ソーステーブル名	デフォルトのソーステーブル名を上書きできます。
トレースレベル	ログファイルに表示される詳細情報の量を設定します。［簡易］、［通常］、［詳細 - 初期化］、［詳細 - データ］から選択できます。デフォルトは［通常］です。

注: フィルタまたはクエリのWHERE句で単一引用符を使用しないでください。

キー範囲パーティション化の設定

フィールド値に基づいてAmazon Redshiftデータをパーティション化するようにキー範囲パーティションを設定します。

1［ソースのプロパティ］で、［パーティション］タブをクリックします。

2リストから必要な［パーティションキー］を選択します。

3［新しいキー範囲の追加］をクリックしてパーティションを追加します。

4［開始範囲］および［終了範囲］を指定します。

注: パーティション化に指定するキー範囲には、単一引用符で囲まれた文字列値を含めることはできません。