Amazon Redshiftコネクタ > 部 III: Amazon Redshiftコネクタを使用したデータ統合 > Amazon Redshiftによるマッピングとマッピングタスク > マッピングのAmazon Redshiftソース
  

マッピングのAmazon Redshiftソース

マッピングでは、ソーストランスフォーメーションを設定して単一のAmazon Redshiftソースまたは複数のAmazon Redshiftソースを表すことができます。
Amazon Redshift標準オブジェクトをソースとして使用できます。標準オブジェクトをプライマリソースとして選択してから、1つ以上の子オブジェクトを追加することができます。
以下の表に、ソーストランスフォーメーションで設定できるAmazon Redshiftソースプロパティを示します。
プロパティ
説明
接続
ソース接続の名前。
ソースタイプ
ソースオブジェクトのタイプ[単一オブジェクト]、[複数のオブジェクト]、[クエリ]、または[パラメータ]を選択します。
オブジェクト
ソースオブジェクトの名前。ソースごとにソースオブジェクトを選択します。
以下の表に、ソーストランスフォーメーションで設定できるAmazon Redshiftクエリオプションを示します。
プロパティ
説明
Filter
読み取り操作で値をフィルタ処理します。[設定]をクリックして、条件を追加してレコードをフィルタ処理し、Secure Agentがソースから読み取る行数を縮小します。
指定できるフィルタ条件を次に示します。
  • - パラメータを使用しません。基本フィルタを使用して、オブジェクト、フィールド、演算子、および値を指定して特定のレコードを選択します。
  • - すべてパラメータを使用します。パラメータを使用してフィールドマッピングを表現します。
  • - 詳細。詳細フィルタを使用して、Amazon Redshiftクエリ形式を使用するさらに複合的なフィルタ条件を定義します。
ソート
該当なし。
以下の表に、ソーストランスフォーメーションで設定できるAmazon Redshiftソースの詳細プロパティを示します。
詳細プロパティ
説明
S3バケット名
Amazon RedshiftターゲットデータのAmazon S3バケット名。
Amazon Redshiftクラスタと同じリージョンでS3バケットを使用します。
圧縮を有効にする
ファイルをAmazon Redshiftに書き込む前に、ステージングファイルを圧縮します。
ランタイム環境でステージングファイルを圧縮するときにタスクパフォーマンスが向上します。
デフォルトではオンに設定されています。
ステージングディレクトリの場所
Amazon Redshiftのステージングディレクトリ。
Secure Agentランタイム環境でタスクを実行する場合は、ランタイム環境内の各Secure Agentマシンで利用できるディレクトリパスを指定します。
Hosted Agentのランタイム環境でタスクを実行する場合は、ステージングディレクトリを空のままにしてください。Hosted Agentは、一時的な場所にディレクトリを作成します。
UnloadOptionsプロパティファイル
Unloadコマンドのオプション。
Amazon RedshiftオブジェクトからS3バケットにデータを書き込むためには、Unloadコマンドにオプションを追加します。次のオプションを追加できます。
  • - DELIMITER
  • - PARALLEL
  • - ESCAPE
  • - AWS_IAM_ROLE
Secure Agentのランタイム環境でタスクを実行するときは、アンロードオプションを含むプロパティファイルのパスを指定するか、[UnloadOptionsプロパティファイル]フィールドで直接アンロードオプションを指定します。
Hosted Agentランタイム環境でタスクを実行するときは、[UnloadOptionsプロパティファイル]フィールドで直接オプションを指定します。
S3クライアントサイドの暗号化の有効化
Secure Agentがプライベート暗号化キーを使用してデータを暗号化することを示します。
暗号化タイプ
ソースの暗号化タイプを選択します。以下の暗号化タイプから選択できます。
  • - SSE-S3
  • - SSE-KMS
デフォルトはSSE-S3です。
S3ファイルの分割ダウンロードの有効化
大きなAmazon S3オブジェクトを複数パーツに分けてダウンロードします。
Amazon S3オブジェクトのファイルサイズが5MBを超える場合は、オブジェクトを複数パーツに分けて同時にダウンロードできます。
パーツサイズ
オブジェクトのパーツサイズを指定します。デフォルトは5MBです。
Infa詳細フィルタ
Amazon Redshiftコネクタには適用されません。
Pre-SQL
Amazon Redshiftからデータを読み取る前にクエリを実行するためのPre-SQLコマンド。UNLOADコマンドまたはCOPYコマンドを使用することもできます。ここで指定するコマンドは、プレーンテキストとして処理されます。
Post-SQL
Amazon Redshiftにデータを書き込んだ後にクエリを実行するためのPost-SQLコマンド。UNLOADコマンドまたはCOPYコマンドを使用することもできます。ここで指定するコマンドは、プレーンテキストとして処理されます。
SQL クエリ
デフォルトクエリーを上書きします。カラム名を二重引用符で囲みます。SQLクエリでは大文字と小文字が区別されます。Amazon RedshiftデータベースでサポートされているSQL文を指定します。
Number of Sorted Ports
クエリが行われたソースの行をソートする場合に使用されるカラム数。エージェントでは、ソース行を読み込む際にデフォルトのクエリにORDER BY句が追加されます。ORDER BY句には、指定された数のポートが、トランスフォーメーションの最初のポートから順に取り込まれます。ソートするポート数を指定する場合、データベースのソート順は、セッションのソート順に一致しなければなりません。
デフォルトは 0 です。
個別選択
一意の値を選択します。このオプションを選択すると、エージェントにSELECT DISTINCT文が含まれます。Amazon Redshiftは末尾のスペースを無視します。したがって、予期されるより少ない行がエージェントで抽出される可能性があります。
ソーステーブル名
デフォルトのソーステーブル名を上書きできます。
トレースレベル
ログファイルに表示される詳細情報の量を設定します。
[簡易]、[通常]、[詳細 - 初期化]、[詳細 - データ]から選択できます。デフォルトは[通常]です。
注: フィルタまたはクエリのWHERE句で単一引用符を使用しないでください。

キー範囲パーティション化の設定

フィールド値に基づいてAmazon Redshiftデータをパーティション化するようにキー範囲パーティションを設定します。
    1[ソースのプロパティ]で、[パーティション]タブをクリックします。
    2リストから必要な[パーティションキー]を選択します。
    3[新しいキー範囲の追加]をクリックしてパーティションを追加します。
    4[開始範囲]および[終了範囲]を指定します。
    注: パーティション化に指定するキー範囲には、単一引用符で囲まれた文字列値を含めることはできません。