プロパティ | 説明 |
---|---|
タスク名 | ファイル取り込みとレプリケーションタスクの名前。ファイル取り込みとレプリケーションタスクの名前は組織内で一意である必要があります。タスク名には、英数字、スペース、およびアンダースコアを含めることができます。名前の先頭には英字またはアンダースコアを指定する必要があります。 タスク名では大文字と小文字が区別されません。 |
場所 | タスクが存在するプロジェクトまたはフォルダ。 |
説明 | タスクの説明(省略可能)。最大長は1024文字です。 |
ランタイム環境 | タスクを実行するランタイム環境。 ファイル取り込みとレプリケーションタスクは、Secure AgentまたはCloud Hosted Agentで実行できます。サーバーレスランタイム環境では実行できません。 |
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元のディレクトリです。デフォルト値は接続で指定されたソースディレクトリです。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ソースディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。パターンは、正規表現またはワイルドカード文字を使用したパターンにすることができます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを含むファイルパスを指定するには、このオプションを選択します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 重複したファイルのスキップに関する情報の転送の詳細については、重複するファイルをスキップを参照してください。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。バッチで転送できるファイルの最大数は20です。 バッチの最大値は、中間ステージング領域を通じてファイルが転送されるかどうかに基づいて異なります。 |
転送モード | ファイル転送モード。次のいずれかのモードを選択します。
注: ネットワークの中断によりバイナリファイル転送が中断された場合、ファイルイベントには中断ステータスが表示されます。ファイル取り込みとレプリケーションジョブを再度実行して、中断されたファイルの転送を再開します。 |
ファイルのピックアップ後 | ファイル転送後のソースファイルの処理を決定します。 次のいずれかのオプションを選択します。
|
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元のディレクトリです。デフォルト値は接続で指定されたソースディレクトリです。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ソースディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。定義したソースディレクトリにあるすべてのサブフォルダからファイルを転送します。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。パターンは、正規表現またはワイルドカード文字を使用したパターンにすることができます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを含むファイルパスを指定するには、このオプションを選択します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。バッチで転送できるファイルの最大数は20です。 |
転送モード | ファイル転送モード。次のいずれかのモードを選択します。
注: ネットワークの中断によりバイナリファイル転送が中断された場合、ファイルイベントには中断ステータスが表示されます。ファイル取り込みとレプリケーションジョブを再度実行して、中断されたファイルの転送を再開します。 |
ファイルのピックアップ後 | ファイル転送後のソースファイルの処理を決定します。 次のいずれかのオプションを選択します。
|
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元のディレクトリです。デフォルト値は接続で指定されたソースディレクトリです。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ソースディレクトリとして追加します。詳細については、「ソースとターゲットのパラメータ」を参照してください。 |
サブフォルダのファイルを含む | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。定義したソースディレクトリにあるすべてのサブフォルダからファイルを転送します。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。パターンは、正規表現またはワイルドカード文字を使用したパターンにすることができます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを含むファイルパスを指定するには、このオプションを選択します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。バッチで転送できるファイルの最大数は20です。 |
ファイルのピックアップ後 | ファイル転送後のソースファイルの処理を決定します。 次のいずれかのオプションを選択します。
|
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | バケット名など、ファイルの転送元であるAmazon S3フォルダパスです。デフォルト値は接続プロパティで指定されたフォルダパスです。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 注: バケットおよび特定のフォルダにアクセスするための十分な特権があることを確認します。 |
パラメータの追加 | 式を作成し、フォルダパスパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。定義したソースディレクトリにあるすべてのサブフォルダからファイルを転送します。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。 パターンで、以下のワイルドカード文字を使用できます。
|
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。このオプションを選択して、ピックアップするファイルのリストを含むパスを指定し、ファイルパスを入力します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。 バッチの最大値は、中間ステージングサーバーを通じてファイルが転送されるかどうかによって異なります。 ファイル取り込みとレプリケーションタスクでは、ファイルが次のソースエンドポイントからターゲットエンドポイントに転送される場合には、中間ステージングサーバーを介してファイルを転送しません。
バッチサイズを定義する場合は、以下のガイドラインに従います。
|
ファイル暗号化タイプ | ファイル転送中に使用するAmazon S3ファイル暗号化のタイプです。 次のいずれかのオプションを選択します。
|
S3高速化転送 | S3バケットでAmazon S3の転送高速化を使用するかどうかを選択します。 転送高速化を使用するには、高速化転送をバケットで有効にする必要があります。選択可能なオプションは、以下のとおりです。
|
最小ダウンロードパートサイズ | 複数の独立したパートセットとしてサイズの大きなファイルをダウンロードする場合の最小ダウンロードパートサイズ。 |
マルチパートダウンロードしきい値 | 複数のパートにオブジェクトを同時にアップロードするタイミングを決定するために使用されるメガバイト単位のマルチパートダウンロードの最小しきい値。 |
ファイルのピックアップ後 | タスクがソースファイルをターゲットにストリーミングした後、ソースファイルをどのように処理するかを決定します。 次のいずれかのオプションを選択します。
|
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、ファイルリストに基づいてファイルをピックアップします。ファイルリストは、ファイル名のカンマ区切りリストで構成されます。ファイルリストオプションは、Cloud統合ハブのサブスクリプションから自動的に取り込まれ、これを編集することはできません。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。バッチで転送できるファイルの最大数は20です。 |
ファイルのピックアップ後 | ファイル転送後のソースファイルの処理を決定します。 次のいずれかのオプションを選択します。
|
オプション | 説明 |
---|---|
ファイルパターン | 転送するファイルの選択に使用するファイル名パターンです。パターンは、正規表現またはワイルドカード文字を使用したパターンにすることができます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | 転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | [ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。 |
ファイルのピックアップ後 | ファイル転送後のソースファイルの処理を決定します。 以下のフィルタオプションのいずれか1つを選択してください。
|
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元のディレクトリです。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ソースディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | 定義したソースディレクトリにあるすべてのサブフォルダからファイルを転送します。 |
ファイルパターン | 転送するファイルの選択に使用するファイル名パターンです。パターンは、正規表現またはワイルドカード文字を使用したパターンにすることができます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | 転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | [ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。 最大バッチサイズは、次の条件に基づいて異なります。
注: Google Cloud StorageからGoogle BigQueryにファイルを転送する場合、タスクは中間ステージングサーバーなしでファイルを転送します。 |
ファイルのピックアップ後 | ファイル転送後にソースファイルに対して実行するアクションを決定します。選択可能なオプションは、以下のとおりです。
例えば、/root/archiveがアーカイブディレクトリ、/root/testがソースディレクトリ、sub1とsub2がソースディレクトリ内のディレクトリで、サブフォルダのファイルを含めるように選択した場合、アーカイブディレクトリのフォルダ構造は/root/archive/sub1、/root/archive/sub2になります。 |
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元のディレクトリです。 |
パラメータの追加 | 式を作成し、ソースディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。定義したソースディレクトリにあるすべてのサブフォルダからファイルを転送します。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。選択したファイルパターンに基づき、ファイル名のパターンを入力します。 次のいずれかのファイルパターンを選択します。
名前にout、fooおよびbazを含むファイルを除くすべてのファイルを示します。 拡張子がdoc、docxまたはpdfのすべてのファイルを示します。 名前にout.txtを含むファイルを除くすべてのファイルを示します。 |
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを含むファイルパスを指定するには、このオプションを選択します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。 |
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元のディレクトリです。Secure Agentがこのディレクトリにアクセスできる必要があります。 ソースフォルダパスの前後のスラッシュの使用は、コネクタ間で異なります。スラッシュを誤って使用すると、接続に失敗します。詳細については、Knowledge Base記事を参照してください。625869 注: ファイルリスナは、NFSおよびCIFSをサポートするネットワーク共有上のファイルおよびディレクトリにアクセスできます。 |
パラメータの追加 | 式を作成し、ソースディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。定義したソースディレクトリにあるすべてのサブフォルダからファイルを転送します。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。選択したファイルパターンに基づき、ファイル名のパターンを入力します。 次のファイルパターンを使用できます。
名前にout、fooおよびbazを含むファイルを除くすべてのファイルを示します。 拡張子がdoc、docxまたはpdfのすべてのファイルを示します。 名前にout.txtを含むファイルを除くすべてのファイルを示します。 |
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
タイムゾーン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 次のいずれかのオプションを選択します。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを含むファイルパスを指定するには、このオプションを選択します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送するファイルの最大数。 デフォルトは5です。バッチで転送できるファイルの最大数は20です。 最大バッチサイズは、次の条件に基づいて異なります。
バッチサイズを定義する場合は、以下のガイドラインに従います。
|
ファイルのピックアップ後 | ファイル転送後のソースファイルの処理を決定します。 選択可能なオプションは、以下のとおりです。
|
詳細ソースプロパティ | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元となるMicrosoft Azure Blob Storageディレクトリ。パスにはコンテナ名を含めます。デフォルト値は接続で指定されたコンテナパスです。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、フォルダパスパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。フォルダパスにあるサブフォルダからファイルを転送します。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。正規表現またはワイルドカード文字を使用できます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 次のいずれかのオプションを選択します。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを含むファイルパスを指定するには、このオプションを選択します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複したファイルをスキップ | 重複したファイルは転送しないでください。ファイル取り込みとレプリケーションタスクによって、同じ名前とサイズのファイルが転送済みである場合、タスクはファイルを再度転送せずにジョブログでファイルを重複とマークします。このオプションが選択されていない場合、タスクはすべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。 最大バッチサイズは、次の条件に基づいて異なります。
注: Azure Blob StorageからAzure SQL Data WarehouseおよびSnowflakeにファイルを転送する場合、タスクは中間ステージングなしでファイルを転送します。 |
詳細ソースプロパティ | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元となるMicrosoft Azure Data Lake Storage Gen2フォルダパス。デフォルト値は接続で指定されたコンテナパスです。ソースディレクトリはスラッシュ(/)で始まる必要があります。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ソースディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。フォルダパスにあるサブフォルダからファイルを転送します。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。正規表現またはワイルドカード文字を使用できます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを含むファイルパスを指定するには、このオプションを選択します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複するファイルをスキップ | 重複したファイルは転送しないでください。ファイル取り込みとレプリケーションタスクによって、同じ名前とサイズのファイルが転送済みである場合、タスクはファイルを再度転送せずにジョブログでファイルを重複とマークします。このオプションが選択されていない場合、タスクはすべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。 最大バッチサイズは、次の条件に基づいて異なります。
注: Microsoft Azure Data Lake Storage Gen2からAzure SQL Data Warehouseにファイルを転送する場合、タスクは中間ステージングなしでファイルを転送します。 |
ブロックサイズ(バイト) | 大きなファイルを指定された小さなブロックサイズに分割します。サイズの大きいファイルを読み取る場合は、ファイルを小さな部分に分割し、同時接続を設定して、データを並列処理するために必要な数のスレッドを生成してください。 デフォルトは、8388608バイト(8MB)です。 |
ファイルのピックアップ後 | ファイル転送後のソースファイルの処理を決定します。選択可能なオプションは、以下のとおりです。
例えば、/root/archiveがアーカイブディレクトリ、/root/testがソースディレクトリ、sub1とsub2がソースディレクトリ内のディレクトリで、サブフォルダからファイルを含めるように選択した場合、アーカイブディレクトリのフォルダ構造は /root/archive/sub1、/root/archive/sub2になります。 |
詳細ソースプロパティ | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元となるMicrosoft Azure Data Lake Storeディレクトリ。デフォルト値は接続で指定されたコンテナパスです。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ソースディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。フォルダパスにあるサブフォルダからファイルを転送します。 |
ファイルパターン | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルの選択に使用するファイル名パターンです。パターンは、正規表現またはワイルドカード文字を使用したパターンにすることができます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。[ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | これは[ファイルピックアップ]が[パターン別]の場合に適用されます。ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
ファイルのリストを含むファイルパス | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを含むファイルパスを指定するには、このオプションを選択します。ファイルには、ファイル名のカンマ区切りリストを必ず入力してください。 |
ファイルリスト | これは[ファイルピックアップ]が[ファイルリスト別]の場合に適用されます。取得するファイルのリストを指定し、ファイル名のコンマ区切りリストを入力するには、このオプションを選択します。 |
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。 最大バッチサイズは、次の条件に基づいて異なります。
注: Azure Blob StorageからAzure SQL Data WarehouseおよびSnowflakeにファイルを転送する場合、タスクは中間ステージングサーバーを使用せずにファイルを転送します。 |
オプション | 説明 |
---|---|
ファイルピックアップ | ファイル取り込みとレプリケーションタスクは、次のファイルピックアップ方法をサポートします。
|
ソースディレクトリ | ファイルの転送元のディレクトリです。 ソースファイルシステムへの相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたソースディレクトリの相対パスです。 注: ファイル取り込みとレプリケーションジョブは、ソースディレクトリに空のファイルがあると失敗します。ただし、サイズフィルタオプションを使用すると、0KBのファイルを選択しないようにすることができます。 |
パラメータの追加 | 式を作成し、ソースディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
サブフォルダのファイルを含む | 定義したソースディレクトリにあるすべてのサブフォルダからファイルを転送します。 |
ファイルパターン | 転送するファイルの選択に使用するファイル名パターンです。パターンは、正規表現またはワイルドカード文字を使用したパターンにすることができます。 次のワイルドカード文字を使用できます。
例えば、次のような正規表現を指定できます。 ([a-zA-Z0-9\s_\\.\-\(\):])+(.doc|.docx|.pdf)$ |
ファイル日付 | 転送するファイルをフィルタする日付と時刻の式。 次のいずれかのオプションを選択します。
日付を指定するには、カレンダーをクリックします。時刻を指定するには、時計をクリックします。 カレンダーをクリックして日付を選択し、時計をクリックして時刻を選択します。 例えば、ファイル取り込みとレプリケーションタスクを毎週実行するようにスケジュールし、前の週に変更されたファイルをフィルタする場合、[本日までの日数]を7に設定します。タスクは、7日前から実行日までの日付のファイルをすべてピックアップします。 |
時間帯 | [ファイル日付]オプションを選択した場合、ファイルが配置されている場所のタイムゾーンを入力します。 |
ファイルサイズ | ファイルサイズに基づいて転送するファイルをフィルタします。ファイルサイズを入力し、ファイルサイズの単位とフィルタオプションを選択します。 以下のフィルタオプションのいずれか1つを選択してください。
|
重複したファイルをスキップ | 重複したファイルをスキップするかどうかを示します。このオプションを選択した場合、ファイル取り込みとレプリケーションタスクは、別のファイルと同じ名前とサイズのファイルは転送しません。ファイル取り込みとレプリケーションタスクはジョブログでこれらのファイルを重複とマークします。このオプションを選択しない場合、タスクは、名前と作成日が重複しているファイルも含め、すべてのファイルを転送します。 |
ファイルの安定性を確認 | ファイル取り込みとレプリケーションタスクがファイルをピックアップする前に、ファイルが安定していることを確認するかどうかを示します。タスクは、現在の実行で検出した不安定なファイルをスキップします。 |
安定性確認間隔 | これは、[ファイルの安定性を確認]オプションを有効にした場合に適用されます。ファイル取り込みとレプリケーションタスクがファイルの安定性を確認するために待機する時間(秒単位)。 例えば、安定性確認時間が15秒の場合、ファイル取り込みとレプリケーションタスクは、定義されたファイルパターンに一致するソースフォルダ内のすべてのファイルを検出し、15秒間待機してから、安定したファイルのみを処理します。 この間隔は、10秒から300秒の範囲です。デフォルトは10秒です。 |
バッチサイズ | ファイル取り込みとレプリケーションタスクが1回のバッチで転送できるファイル数。 デフォルトは5です。 一度に転送できるテーブルの最大数は20です。 |
ファイルのピックアップ後 | ファイル転送後にソースファイルに対して実行するアクションを決定します。選択可能なオプションは、以下のとおりです。
例えば、lakehouse/Files/archiveがアーカイブディレクトリ、lakehouse/Files/testがソースディレクトリ、sub1とsub2がソースディレクトリ内のディレクトリで、サブフォルダのファイルを含めるように選択した場合、アーカイブディレクトリのフォルダ構造はlakehouse/Files/archive/sub1、lakehouse/Files/archive/sub2になります。 |
システム変数 | 説明 | 式 |
---|---|---|
BadFileDir * | リジェクトファイルのディレクトリ。次の特殊文字は使用できません。 * ? < > " | , | ${$PMBadFileDir} |
CacheFileDir * | キャッシュファイルの場所。 | ${$PMCacheDir} |
Date ** | ISO(yyyy-MM-dd)形式の現在の日付。 | ${system.date} |
Day ** | 曜日 | ${system.day} |
ExtProcDir * | 外部プロシージャのディレクトリ。次の特殊文字は使用できません。 * ? < > " | , | ${$PMExtProcDir} |
Hours ** | 時間 | ${system.hours} |
JobId | 現在のジョブのID(またはジョブ番号)。 | ${system.jobid} |
LookupFileDir * | ルックアップファイルのディレクトリ。次の特殊文字は使用できません。 * ? < > " | , | ${$PMLookupFileDir} |
Minutes ** | 分 | ${system.minutes} |
Month ** | 月(数値) | ${system.month} |
Name | 現在のプロジェクトの名前。 | ${system.name} |
RootDir * | ノードによるルートディレクトリへのアクセス性。これは他のサービスプロセス変数のルートディレクトリです。次の特殊文字は使用できません。 * ? < > " | , | ${$PMRootDir} |
RunId | ジョブが実行されたときのID。 | ${system.runid} |
Seconds ** | 秒 | ${system.seconds} |
SessionLogDir * | セッションログのディレクトリ。次の特殊文字は使用できません。 * ? < > " | , | ${$PMSessionLogDir} |
SourceFileDir * | ソースファイルのディレクトリ。次の特殊文字は使用できません。 * ? < > " | , | ${$PMSourceFileDir} |
StorageDir * | 実行時ファイルのディレクトリ。ワークフローリカバリファイルは、PowerCenter統合サービスプロパティで設定された$PMStorageDirに保存されます。セッションリカバリファイルは、オペレーティングシステムプロファイルで設定された$PMStorageDirに保存されます。次の特殊文字は使用できません。 * ? < > " | , | ${$PMStorageDir} |
TargetFileDir * | ターゲットファイルのディレクトリ。次の特殊文字は使用できません。 * ? < > " | , | ${$PMTargetFileDir} |
TempDir * | 一時ファイルのディレクトリ。次の特殊文字は使用できません。 * ? < > " | , | ${$PMTempDir} |
Timestamp ** | ISO(yyyy-MM-dd HH:mm:ss)形式の現在の日付と時刻。 | ${system.timestamp} |
WorkflowLogDir * | ワークフローログファイルの場所です。 | ${$PMWorkflowLogDir} |
Year ** | 年 | ${system.year} |
* 値はデータ統合サーバーから取得されます。 ** タイムゾーンはSecure Agentのタイムゾーンです。 |
オプション | 説明 |
---|---|
ターゲットディレクトリ | ファイル転送先のディレクトリです。 デフォルト値は接続で指定されたターゲットディレクトリです。 相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたターゲットディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ターゲットディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイルが存在する場合 | ターゲットディレクトリに同じ名前のファイルがすでにある場合に、ファイルの処理を決定します。次のいずれかのオプションを選択します。
|
転送モード | ファイル転送モード。次のいずれかのオプションを選択します。
注: ネットワークの中断によりバイナリファイル転送が中断された場合、ファイルイベントには中断ステータスが表示されます。ファイル取り込みとレプリケーションジョブを再度実行して、中断されたファイルの転送を再開します。 |
中間ファイルの作成 | ファイルがターゲットの場所に完全に転送されるまでの中間ファイルを作成します。 例えば、file.txtという名前のファイルをソースからターゲットに転送すると、ファイルが完全に転送されるまで、ターゲットの場所にfile.txt_644a1f88という名前の中間ファイルが表示されます。 |
オプション | 説明 |
---|---|
ターゲットディレクトリ | ファイル転送先のディレクトリです。 デフォルト値は接続で指定されたターゲットディレクトリです。 相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたターゲットディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ターゲットディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイルが存在する場合 | ターゲットディレクトリに同じ名前のファイルがすでにある場合に、ファイルの処理を決定します。次のいずれかのオプションを選択します。
|
転送モード | ファイル転送モード。次のいずれかのオプションを選択します。
注: ネットワークの中断によりバイナリファイル転送が中断された場合、ファイルイベントには中断ステータスが表示されます。ファイル取り込みとレプリケーションジョブを再度実行して、中断されたファイルの転送を再開します。 |
中間ファイルの作成 | ファイルがターゲットの場所に完全に転送されるまでの中間ファイルを作成します。 例えば、file.txtという名前のファイルをソースからターゲットに転送すると、ファイルが完全に転送されるまで、ターゲットの場所にfile.txt_644a1f88という名前の中間ファイルが表示されます。 |
オプション | 説明 |
---|---|
ターゲットディレクトリ | ファイル転送先のディレクトリです。 デフォルト値は接続で指定されたターゲットディレクトリです。 相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたターゲットディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ターゲットディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイルが存在する場合 | ターゲットディレクトリに同じ名前のファイルがすでにある場合に、ファイルの処理を決定します。次のいずれかのオプションを選択します。
|
中間ファイルの作成 | ファイルがターゲットの場所に完全に転送されるまでの中間ファイルを作成します。 例えば、file.txtという名前のファイルをソースからターゲットに転送すると、ファイルが完全に転送されるまで、ターゲットの場所にfile.txt_644a1f88という名前の中間ファイルが表示されます。 |
オプション | 説明 |
---|---|
ターゲットテーブル名 | ファイルがロードされるAmazon Redshift内のテーブルの名前。 注: 転送できるのは、ソースファイルのメタデータに一致するファイルのみです。ジョブを実行する前に、ターゲットテーブルが存在することを確認してください。 |
スキーマ | Amazon Redshiftのスキーマ名。 デフォルト値はターゲット接続の確立中に使用されるスキーマです。 |
パラメータの追加 | |
ターゲットテーブルの切り詰め | テーブルにデータをロードする前に、ターゲットテーブルを切り詰めます。 |
ターゲットテーブルの分析 | Analyzeコマンドはデータベース内のテーブル内容に関する統計情報を収集し、クエリの最も効率的な実行計画を決定します。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
ターゲットテーブルのクリーンアップ | ターゲットテーブルのクリーンアップを選択すると、ディスク領域を回復し、指定されたテーブルの行をソートできます。 以下のリカバリオプションのいずれか1つを選択してください。
注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
ファイル形式およびコピーオプション | データをコピーする場合の形式を選択します。次のいずれかのオプションを選択します。
|
プロパティ | 説明 |
---|---|
COPYコマンド | Amazon Redshift COPYコマンドは、データをテーブル内の既存の行に付加します。 Amazon S3ステージングディレクトリとAmazon Redshiftターゲットが異なるリージョンに属している場合は、COPYコマンドでリージョンを指定する必要があります。 以下に例を示します。 copy public.messages from '{{FROM-S3PATH}}' credentials 'aws_access_key_id={{ACCESS-KEY-ID}};aws_secret_access_key={{SECRET-ACCESS-KEY-ID}}' MAXERROR 0 REGION '' QUOTE '"' DELIMITER ',' NULL '' CSV; ここで、publicにはスキーマ、messagesにはテーブル名を指定します。 COPYコマンドの詳細については、AWSのマニュアルを参照してください。 |
プロパティ | 説明 |
---|---|
Pre SQL | ファイル取り込みとレプリケーションタスクがCOPYコマンドを実行する前に実行するSQLコマンド。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
Post SQL | ファイル取り込みとレプリケーションタスクがCOPYコマンドを実行した後に実行するSQLコマンド。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
S3ステージングディレクトリ | Amazon S3ステージングディレクトリを指定します。 Amazon S3ステージングディレクトリは、<bucket_name/folder_name>の形式で指定する必要があります。 ステージングディレクトリは、ファイル取り込みとレプリケーションタスクの実行後に削除されます。 |
中間ステージングなしでRedshiftにアップロード | 中間ステージングを追加せずに、Amazon S3ソースディレクトリからAmazon RedshiftにAmazon S3のファイルを直接アップロードします。 このオプションを選択する場合は、Amazon S3バケットとAmazon S3ステージングディレクトリが同じリージョンに属していることを確認します。 このオプションを選択しない場合は、Amazon S3ステージングディレクトリとAmazon Redshiftターゲットが同じリージョンに属していることを確認します。 |
ファイル圧縮* | ファイルがターゲットディレクトリに転送される前に圧縮されるかどうかを決定します。次のいずれかのオプションを選択します。
|
ファイル暗号化タイプ* | ファイル転送中に使用するAmazon S3ファイル暗号化のタイプです。次のいずれかのオプションを選択します。
注: Amazon S3がソースの場合、クライアントサイド暗号化はタスクに適用されません。 |
S3高速転送* | S3バケットでAmazon S3の転送高速化を使用するかどうかを選択します。転送高速化を使用するには、高速化転送をバケットで有効にする必要があります。次のいずれかのオプションを選択します。
|
最小アップロードパートサイズ* | 複数の独立したパートセットとしてサイズの大きなファイルをアップロードする場合の最小アップロードパートサイズ。このオプションを使用して、ファイルのロードをAmazon S3に合わせます。 |
マルチパートアップロードしきい値* | 複数のパートにオブジェクトを同時にアップロードするタイミングを決定するメガバイト単位のマルチパートダウンロードの最小しきい値。 |
*AmazonS3からAmazon Redshift V2にデータを読み取る場合は適用されません。 |
オプション | 説明 |
---|---|
フォルダパス | バケット名など、ファイルの転送先であるAmazon S3フォルダです。デフォルト値は接続で指定されたフォルダパスです。 相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたターゲットディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、フォルダパスパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイル圧縮 | ファイルがターゲットディレクトリに転送される前に圧縮されるかどうかを決定します。次のいずれかのオプションを選択します。
|
ファイル暗号化タイプ | ファイル転送中に使用するAmazon S3ファイル暗号化のタイプです。次のいずれかのオプションを選択します。
|
ファイルが存在する場合 | ターゲットディレクトリに同じ名前のファイルがすでにある場合に、ファイルの処理を決定します。以下のフィルタオプションのいずれか1つを選択してください。
|
S3高速化転送 | S3バケットでAmazon S3の転送高速化を使用するかどうかを選択します。転送高速化を使用するには、高速化転送をバケットで有効にする必要があります。次のいずれかのオプションを選択します。
|
最小アップロードパートサイズ | 複数の独立したパートセットとしてサイズの大きなファイルをアップロードする場合の最小アップロードパートサイズ。このオプションを使用して、ファイルのロードをAmazon S3に合わせます。 |
マルチパートアップロードしきい値 | 複数のパートにオブジェクトを同時にアップロードするタイミングを決定するメガバイト単位のマルチパートダウンロードの最小しきい値。 |
オプション | 説明 |
---|---|
データベース | 必須。ターゲットテーブルを含むDatabricks Lakeのデータベースの名前。 相対値を使用して、接続で渡されるデータベース値を選択できます。相対値を使用するには、省略記号(...)を入力します。 |
パラメータの追加 | |
テーブル名 | 必須。Databricksの既存のテーブルの名前。 |
テーブルが存在する場合 | テーブル名がターゲットデータベース内の既存のテーブルの名前と一致する場合に、Secure Agentがテーブルに対して実行する必要のあるアクションを決定します。次のいずれかのオプションを選択します。
デフォルトは[上書き]です。 |
オプション | 説明 |
---|---|
ターゲットテーブル名 | Google BigQueryターゲットテーブル名を指定します。 注: 転送できるのは、ソースファイルのメタデータに一致するファイルのみです。ジョブを実行する前に、ターゲットテーブルが存在することを確認してください。 |
データセットID | Google BigQueryデータセット名を指定します。 |
パラメータの追加 | |
フィールド区切り文字 | Google BigQuery V2コネクタで.csvファイルのフィールドのフィールド区切り文字を許可する必要があるかどうかを示します。 |
文字列の引用符 | Google BigQueryにデータを書き込むときにスキップする引用符を指定します。Google BigQueryにデータを書き込む際に、指定した引用符がソーステーブルに含まれていると、タスクは失敗します。引用符の値をソーステーブルに存在しない値に変更します。 |
引用符付きの改行の許可 | Google BigQuery V2コネクタが.csvファイルで改行文字を含む引用符で囲まれたデータセクションを許可する必要があるかどうかを示します。 |
ジャグ行の許可 | Google BigQuery V2コネクタで.csvファイルの後続フィールドのない行を許可する必要があるかどうかを示します。 |
先頭行のスキップ | Google BigQueryV2コネクタがデータのロード時にスキップするソースファイルの最上位行の数を指定します。 デフォルトは0です。 |
ファイルのデータ形式 | ソースファイルのデータ形式を指定します。以下のいずれかのデータ形式を選択できます。
|
書き込み処理 | ターゲットテーブルがすでに存在する場合に、Google BigQuery V2コネクタがバルクモードでデータを書き込む方法を指定します。 次の値から選択することができます。
|
オプション | 説明 |
---|---|
フォルダパス | ファイルが転送されるGoogle Cloud Storageのパス。バケット名、またはバケット名とフォルダ名のいずれかを入力できます。 例えば、<バケット名>または<バケット名>/<フォルダ名>と入力します。 注: パスの先頭に、1つのスラッシュ(/)を使用しないでください。 相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたバケットの相対パスです。 |
パラメータの追加 | 式を作成し、フォルダパスパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイル圧縮 | ファイルがターゲットディレクトリに転送される前に圧縮されるかどうかを決定します。次のいずれかのオプションを選択します。
|
ファイルが存在する場合 | 同じ名前のファイルがターゲットディレクトリに存在する場合に、Secure Agentがファイルに対して実行する必要のあるアクションを決定します。次のいずれかのオプションを選択します。
|
オプション | 説明 |
---|---|
ターゲットディレクトリ | ファイル転送先のディレクトリです。 |
パラメータの追加 | 式を作成し、ターゲットディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
オプション | 説明 |
---|---|
ターゲットディレクトリ | ファイル転送先のディレクトリです。Secure Agentがこのディレクトリにアクセスできる必要があります。 |
パラメータの追加 | 式を作成し、ターゲットディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイルが存在する場合 | ターゲットディレクトリに同じ名前のファイルがある場合に、ファイルの処理を決定します。次のいずれかのオプションを選択します。
|
中間ファイルの作成 | ファイルがターゲットの場所に完全に転送されるまでの中間ファイルを作成します。 例えば、file.txtという名前のファイルをソースからターゲットに転送すると、ファイルが完全に転送されるまで、ターゲットの場所にfile.txt_644a1f88という名前の中間ファイルが表示されます。 重要: Amazon S3 V2、Google Cloud Storage V2、Microsoft Azure Blob Storage v3、Microsoft Azure Data Lake Storage Gen2、およびHadoop Files V2からデータを読み取る場合は適用されません。 |
オプション | 説明 |
---|---|
BLOBコンテナ | Microsoft Azure Blob Storageコンテナ(フォルダパスとコンテナ名を含む)。 |
パラメータの追加 | 式を作成し、BLOBコンテナパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
BLOBのタイプ | BLOBのタイプ。次のいずれかのオプションを選択します。
|
ファイル圧縮 | ファイルがターゲットディレクトリに転送される前に圧縮されるかどうかを決定します。選択可能なオプションは、以下のとおりです。
|
Blob Storeへの同時接続数 | Microsoft Azure Blob Storageコンテナへの同時接続数。 |
ターゲットプロパティ | 説明 |
---|---|
ターゲットディレクトリ | ファイル転送先のディレクトリです。ディレクトリが存在しない場合は、実行時に作成されます。実行時に指定されたディレクトリパスで、接続の作成時に指定されたパスが上書きされます。 デフォルト値は接続で指定されたターゲットディレクトリです。 相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたターゲットディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ターゲットディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイル圧縮 | ファイルがターゲットディレクトリに転送される前に圧縮されるかどうかを決定します。選択可能なオプションは、以下のとおりです。
|
ファイルが存在する場合 | ターゲットディレクトリに同じ名前のファイルがある場合に、ファイルの処理を決定します。選択可能なオプションは、以下のとおりです。
|
ブロックサイズ(バイト) | 大きなファイルを指定された小さなブロックサイズに分割します。サイズの大きいファイルを書き込む場合は、ファイルを小さな部分に分割し、同時接続を設定して、データを並列処理するために必要な数のスレッドを生成してください。 デフォルトは、8388608バイト(8MB)です。 |
ターゲットプロパティ | 説明 |
---|---|
ターゲットディレクトリ | ファイル転送先のディレクトリです。 デフォルト値は接続で指定されたターゲットディレクトリです。 相対パスを入力できます。相対パスを入力するには、パスをピリオドで開始し、その後にスラッシュを続けます(./)。パスは、接続で指定されたターゲットディレクトリの相対パスです。 |
パラメータの追加 | 式を作成し、ターゲットディレクトリパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイル圧縮 | ファイルがターゲットディレクトリに転送される前に圧縮されるかどうかを決定します。選択可能なオプションは、以下のとおりです。
|
ファイルが存在する場合 | ターゲットディレクトリに同じ名前のファイルがある場合に、ファイルの処理を決定します。選択可能なオプションは、以下のとおりです。
|
プロパティ | 説明 |
---|---|
取り込み方法 | Microsoft Azure Synapse SQLにデータをロードするための取り込み方法。 次のいずれかのオプションを選択します。
|
コマンドのタイプ | 取り込み方法のコマンドタイプ。 次のいずれかのオプションを選択します。
|
プロパティ | 説明 |
---|---|
ターゲットテーブル名 | ファイルをロードするMicrosoft Azure Synapse SQLのテーブルの名前。 注: 転送できるのは、ソースファイルのメタデータに一致するファイルのみです。ジョブを実行する前に、ターゲットテーブルが存在することを確認してください。 |
パラメータの追加 | |
スキーマ | Microsoft Azure Synapse SQLスキーマ名。相対値を入力して、接続で渡されるスキーマ値を選択できます。相対値を使用するには、省略記号(...)を入力します。 |
ターゲットテーブルの切り詰め | ロード前にターゲットテーブルを切り詰めます。 |
Pre SQL | ファイル取り込みとレプリケーションタスクがPolyBaseまたはCopyコマンドを実行する前に実行するSQLコマンド。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
Post SQL | ファイル取り込みとレプリケーションタスクがPolyBaseまたはCopyコマンドを実行した後で実行するSQLコマンド。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
フィールド区切り文字 | ファイル内のフィールドを区切るために使用する文字。デフォルト値は0x1eです。リストから以下のフィールド区切り文字を選択できます。 ~ ` | .TAB 0x1e |
文字列の引用符 | Microsoft Azure Synapse SQLにデータを書き込むときにスキップする引用符を指定します。Microsoft Azure Synapse SQLにデータを書き込む際に、指定した引用符がソーステーブルに含まれていると、タスクは失敗します。引用符の値をソーステーブルに存在しない値に変更します。 |
外部ステージ* | ファイルをMicrosoft Azure Synapse SQLにロードする際に使用する外部ステージディレクトリを指定します。ファイルは、Microsoft Azure Blob StorageまたはMicrosoft Azure Data Lake Storage Gen2でステージングできます。 ファイル取り込みとレプリケーションタスクは、AdministratorのMicrosoft Azure Synapse SQL接続の次のプロパティで指定された値を使用して、外部ステージパスプロパティを自動的に入力します。
値をオーバーライドできます。 |
ファイル圧縮* | ターゲットディレクトリへの転送の前にファイルを圧縮するかどうかを指定します。 選択可能なオプションは、以下のとおりです。
|
同時接続数* | Microsoft Azure Blob StorageまたはMicrosoft Azure Data Lake Storage Gen2からデータを抽出する際の同時接続数。サイズの大きいファイルまたはオブジェクトを読み取る場合は、複数のスレッドを生成してデータを処理できます。BLOBパートサイズまたはブロックサイズを設定して、大きなファイルを小さな部分に分割します。 デフォルト値は4です。最大値は10です。 |
*Microsoft Azure Blob StorageまたはMicrosoft Azure Data Lake Storage Gen2からデータを読み取る場合は適用されません。 |
プロパティ | 説明 |
---|---|
ファイル形式の定義 | Polybase取り込み方法に適用されます。 Transact-SQL CREATE EXTERNAL FILE FORMAT文。以下に例を示します。 CREATE EXTERNAL FILE FORMAT {{fileFormatName}} WITH ( FORMAT_TYPE = DELIMITEDTEXT, FORMAT_OPTIONS (FIELD_TERMINATOR = ',', STRING_DELIMITER = '"') ) 以下は、Parquet形式で外部ファイルを作成する例です。 CREATE EXTERNAL FILE FORMAT {{fileFormatName}} WITH (FORMAT_TYPE = PARQUET) 同様に、JSON、Avro、およびORC形式で外部ファイルを作成できます。 CREATE EXTERNAL FILE FORMAT文の詳細については、Microsoftのマニュアルを参照してください。 |
外部テーブルの定義 | Polybase取り込み方法に適用されます。 Transact-SQL CREATE EXTERNAL TABLE文。以下に例を示します。 CREATE EXTERNAL TABLE {{externalTable}} ( id INT, name NVARCHAR ( 100 ) ) WITH (LOCATION = '{{blobLocation}}', DATA_SOURCE = {{dataSourceName}}, FILE_FORMAT = {{fileFormatName}}) 以下は、Parquet形式で外部テーブルを作成する例です。 CREATE EXTERNAL TABLE {{externalTable}}(username VARCHAR(100)、number int、colour VARCHAR(100))WITH(LOCATION = '{{blobLocation}}'、DATA_SOURCE = {{dataSourceName}}、FILE_FORMAT = {{fileFormatName} }) 同様に、JSON、Avro、およびORC形式で外部テーブルを作成できます。 CREATE EXTERNAL TABLE文の詳細については、Microsoftのマニュアルを参照してください。 |
Insert SQLの定義 | Polybase取り込み方法に適用されます。 Transact-SQL INSERT文。以下に例を示します。 INSERT INTO schema.table (id, name) SELECT id+5, name FROM {{externalTable}} 以下は、Parquet形式で挿入SQLを定義する例です。 INSERT INTO testing.test_parq(username,number,colour) SELECT username, number,colour FROM {{externalTable}}; 同様に、JSON、Avro、およびORC形式でInsert SQLを定義できます。 INSERT文の詳細については、Microsoftのマニュアルを参照してください。 |
Copyコマンドの定義 | COPYコマンドの取り込み方法に適用されます。 Transact-SQL COPY INTO文。以下に例を示します。 COPY INTO schema.table FROM EXTERNALLOCATION WITH(CREDENTIAL = (AZURECREDENTIALS), FIELDTERMINATOR = ',', FIELDQUOTE = '') 以下は、Parquet形式でCOPYコマンドを定義する例です。 COPY INTO testing.test_parq FROM EXTERNALLOCATION WITH(CREDENTIAL = (AZURECREDENTIALS), FILE_TYPE = 'PARQUET') 同様に、JSON、Avro、およびORC形式でCOPYコマンドを定義できます。 COPY INTO文の詳細については、Microsoftのマニュアルを参照してください。 |
Pre SQL | ファイル取り込みとレプリケーションタスクがPolyBaseコマンドを実行する前に実行するSQLコマンド。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
Post SQL | ファイル取り込みとレプリケーションタスクがPolyBaseコマンドを実行した後に実行するSQLコマンド。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
外部ステージ* | ファイルをMicrosoft Azure Synapse SQLにロードする際に使用する外部ステージディレクトリを指定します。ファイルは、Microsoft Azure Blob StorageまたはMicrosoft Azure Data Lake Storage Gen2でステージングできます。 |
同時接続数* | Microsoft Azure Blob StorageまたはMicrosoft Azure Data Lake Storage Gen2からデータを抽出する際の同時接続数。サイズの大きいファイルまたはオブジェクトを読み取る場合は、複数のスレッドを生成してデータを処理できます。BLOBパートサイズまたはブロックサイズを設定して、大きなファイルを小さな部分に分割します。 デフォルト値は4です。最大値は10です。 |
*Microsoft Azure Blob StorageまたはMicrosoft Azure Data Lake Storage Gen2からデータを読み取る場合は適用されません。 |
オプション | 説明 |
---|---|
ターゲットディレクトリ | ファイル転送先のディレクトリです。Secure Agentがこのディレクトリにアクセスできる必要があります。 |
パラメータの追加 | 式を作成し、フォルダパスパラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
ファイル圧縮 | ファイルがターゲットディレクトリに転送される前に圧縮されるかどうかを決定します。次のいずれかのオプションを選択します。
|
ファイルが存在する場合 | 同じ名前のファイルがターゲットディレクトリに存在する場合に、Secure Agentがファイルに対して実行する必要のあるアクションを決定します。次のいずれかのオプションを選択します。
注: バイナリファイルに対してappendオプションを指定してジョブを実行した場合、ファイルの内容は追加されません。 |
プロパティ | 説明 |
---|---|
ウェアハウス | Snowflake Data Cloud接続で指定された名前をオーバーライドします。相対値を入力して、接続で渡されるウェアハウス値を選択できます。相対値を入力するには、3つのピリオドを入力します(...)。 |
パラメータの追加 | 式を作成して、ウェアハウスパラメータ、データベースパラメータ、スキーマパラメータおよびターゲットテーブル名パラメータとして追加します。詳細については、ソースとターゲットのパラメータを参照してください。 |
データベース | Snowflake Data Cloudのデータベース名。 |
スキーマ | Snowflake Data Cloudのスキーマ名。 |
ターゲットテーブル名 | Snowflake Data Cloudターゲットテーブルのテーブル名。 ターゲットテーブル名では、大文字と小文字が区別されます。 注: 転送できるのは、ソースファイルのメタデータに一致するファイルのみです。ジョブを実行する前に、ターゲットテーブルが存在することを確認してください。 |
ロール | 接続で指定されたSnowflake Data Cloudユーザーロールをオーバーライドします。相対値を入力して、接続で渡されるロール値を選択できます。相対値を使用するには、省略記号(...)を入力します。 |
Pre SQL | 書き込み操作の開始前にターゲットで実行されるSQL文。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
Post SQL | 書き込み操作の完了後にターゲットテーブルで実行されるSQL文。 注: [並行バッチ]の値が1より大きい場合であっても、この操作はすべてのバッチに対して実行されます。 |
ターゲットテーブルの切り詰め | 新しい行を挿入する前にデータベースターゲットテーブルをトランケートします。すべての行を挿入する前にターゲットテーブルを切り詰める場合は、このオプションを有効にします。このオプションを無効にすると、ターゲットテーブルを切り詰めずに新しい行が挿入されます。 |
ファイル形式およびコピーオプション | Snowflake Data Cloudにデータを読み込むためのコピーオプションとファイル形式。 コピーオプションは、ファイルからデータを読み込むときにエラーが発生した場合にタスクが実行するアクションを指定します。 エラーが発生したときにCOPY文を中止するには、次のコピーオプションを指定できます。 ON_ERROR = ABORT_STATEMENT ファイルを読み込む際に、ファイル形式を指定し、データファイルのルールを定義します。タスクはデータをSnowflake Data Cloudテーブルに一括読み込みする際に、指定されたファイル形式とルールを使用します。 次の形式がサポートされています。
|
外部ステージ | ファイルをSnowflake Data Cloudテーブルに読み込む際に使用する外部ステージディレクトリを指定します。 指定したソースフォルダパスが、Snowflake Data Cloudでの特定の接続タイプに対する外部ステージのURLで指定されているフォルダパスと同じであることを確認してください。 ファイル取り込みとレプリケーションのソースがMicrosoft Azure Blob StorageおよびAmazon S3である場合に適用されます。外部ステージは、接続タイプとしてMicrosoft Azure Blob Storage V3を使用する場合は必須ですが、Amazon S3 V2を使用する場合はオプションです。Amazon S3 V2の場合に外部ステージを指定しなかった場合、Snowflake Data Cloudはデフォルトで外部ステージを作成します。 |
ファイル圧縮 | ファイルがターゲットディレクトリに転送される前に圧縮されるかどうかを決定します。 選択可能なオプションは、以下のとおりです。
Microsoft Azure Blob Storage V3およびAmazon S3 V2以外の、ファイル取り込みとレプリケーションタスクをサポートするすべてのソースに適用されます。 |
アクション | 説明 |
---|---|
圧縮 | ファイルを圧縮するには、[圧縮]を選択します。その後、次のアクションタイプのいずれかを選択します。
パスワードを入力して.zipファイルを保護することができます。.zipファイルに複数のファイルが含まれている場合は、すべての圧縮ファイルに同じパスワードが適用されます。 |
圧縮解除 | 圧縮ファイルを圧縮解除するには、[圧縮解除]を選択します。その後、次のアクションタイプのいずれかを選択します。
ファイルの圧縮に使用された圧縮アクションタイプに対応するアクションタイプを使用してください。たとえば、.zipファイルの場合は、Unzipの方法を使用します。 パスワードで保護された.zipファイルを解凍するには、正しいパスワードを入力してください。誤ったパスワードで圧縮ファイルを解凍しようとすると、ジョブは失敗します。例えば、5ファイルのうち、4ファイルが同じパスワードで保護され、残りの1つのファイルが別のパスワードで保護されている場合に、ジョブが誤ったパスワードでファイルを解凍しようとすると失敗します。 パスワードを使用していない圧縮ファイルを開くと、ファイル取り込みとレプリケーションは、アクションで入力したパスワードを無視します。例えば、5ファイルのうち、4ファイルのみがパスワードで保護されている場合、ジョブは正常に実行され、5ファイルすべてが解凍されます。 |
暗号化 | PGP暗号化方法を使用してファイルを暗号化するには、[暗号化]を選択します。次に、[PGP]を選択して、ファイルを復号化するユーザーのキーIDを入力します。
キーIDとキーパスフレーズが有効になります。 注: ファイル取り込みとレプリケーションで転送されるファイルの保護に関する詳細については、「ファイル取り込みとレプリケーションのセキュリティ」を参照してください。 |
復号化 | PGPで暗号化されたファイルを復号化するには、[復号化]を選択します。次に、[PGP]を選択して、ターゲットディレクトリのユーザーのキーパスフレーズを入力します。キーパスフレーズにはスペースを含めないでください。 |
ファイル操作 | ターゲットディレクトリ内のファイルに対して操作を実行するには、[ファイル操作]を選択します。その後、次のアクションタイプのいずれかを選択します。
アクションとしてファイルの名前を変更することを選択した場合は、変数を入力して、名前を変更したファイルに接尾辞を付けます。 |
ウイルススキャン | ICAPプロトコルを使用してファイルのウイルスをスキャンするには、[ウイルススキャン]を選択します。次に、[ICAP]を選択して、[ICAPサーバーURL]またはファイルがスキャンされるサーバーを入力します。ICAPは、マルウェアがファイルで検出されたかどうかを示す応答コードを送信します。 注: 組織のICAPサーバーを使用します。 |