アプリケーション取り込みとレプリケーション > アプリケーション取り込みとレプリケーション > アプリケーション取り込みおよびレプリケーションタスクの設定
  

アプリケーション取り込みおよびレプリケーションタスクの設定

データ統合で、アプリケーション取り込みとレプリケーションタスクウィザードを使用して、アプリケーション取り込みとレプリケーションタスクを設定できます。
Snowflakeターゲットを持つ初期ロードタスクと増分ロードタスクをデータ統合タスクフローと統合することができます。詳細については、「アプリケーション取り込みおよびレプリケーションタスクとデータ統合タスクフローの統合」を参照してください。
アプリケーション取り込みとレプリケーションタスクを設定するには、ホームページの[取り込み]パネルをクリックして、タスク設定ウィザードで次の設定タスクを完了します。
  1. 1デフォルトのランタイム環境を設定していない場合は、ランタイム環境を選択します。
  2. 2接続先となる接続を選択するか、新しい接続を設定します。
  3. 3ソース接続を選択するか、新しい接続を設定します。
  4. 4ソースとターゲットのタスクの詳細を指定します。
  5. 5トリムトランスフォーメーションを設定します(オプション)。
  6. 6タスク名、タスク定義の場所、ランタイム環境、およびいくつかのオプションのプロパティを入力して、タスク定義を確定します。次に、タスクを保存します。
[次へ]または[戻る]をクリックして別のページに移動します。任意のタイミングで[保存]をクリックして、それまでに入力した情報を、生成されたタスク名でExploreのデフォルトの場所に保存することができます。タスク定義の最終処理を行ってから、カスタムタスクの名前と場所を入力します。
ウィザードのすべてのページが完了した後に、タスク定義を保存します。次に、[デプロイ]をクリックして、Secure Agentで実行可能なジョブインスタンスとしてタスクを利用できるようにします。

始める前に

アプリケーション取り込みとレプリケーションタスクを設定する前に、Administratorで次の前提条件タスクを完了します。

取り込みおよびレプリケーションタスクウィザードの開始

組織で最新のタスクウィザードが有効になっている場合は、[ホーム]ページからウィザードを開始できます。
次のいずれかの方法でウィザードを開始します。
注:
ファイル取り込みとレプリケーションとストリーミング取り込みとレプリケーションでは、従来からの既存のウィザードが使用されます。

プライマリクラウドデータウェアハウスのセットアップ

データ統合のホームページから、通常、データをロードするプライマリクラウドデータウェアハウスの接続先を設定できます。
この操作を行うと、新しいウィザードで作成するアプリケーション取り込みおよびレプリケーションタスクとデータベース取り込みおよびレプリケーションタスクが、この接続先にデータをロードするように自動的に設定されます。必要に応じて、接続先を変更することもできます。
選択したクラウドデータウェアハウスは、現在ログインしている組織に適用されます。複数の組織にアクセスできる場合は、組織とサブ組織ごとに異なるプライマリクラウドデータウェアハウスを設定できます。
セットアップ手順は、プライマリクラウドデータウェアハウスの設定が完了しているかどうかに応じて異なります。設定が完了している場合は、その設定を変更するか、選択解除することができます。

プライマリクラウドデータウェアハウスの設定

[ホーム]ページからプライマリクラウドデータウェアハウスの設定を行います。
    1[ホーム]ページの[クラウドデータウェアハウスをプライマリの接続先として使用しますか?]パネルで、[はい、開始します]をクリックします。
    2[接続先]ページで、クラウドデータウェアハウスのタイプ(Snowflake Data CloudやDatabricks Deltaなど)を選択し、[次へ]をクリックします。
    3[接続]ページで接続を選択するか、[新規]をクリックして接続プロパティを入力します。
    4[接続]をクリックします。

プライマリクラウドデータウェアハウスの変更または選択解除

プライマリクラウドデータウェアハウスの設定が完了している場合、この設定を変更または選択解除できます。[ホーム]ページからプライマリクラウドデータウェアハウスの変更または選択解除を行います。
    1[ホーム]ページで、右上隅にあるクラウドデータウェアハウスのタイプをクリックし、[プライマリクラウドデータウェアハウスの変更]を選択します。
    2プライマリクラウドデータウェアハウスを変更する場合は、[プライマリクラウドデータウェアハウスがあります]を選択します。
    3クラウドデータウェアハウスタイプを変更するには、次の手順を実行します。
    1. a[タイプ]の横にある[変更]をクリックします。
    2. b[接続先]ページで、データウェアハウスのタイプを選択し、[次へ]をクリックします。
    3. c[接続]ページで接続を選択するか、[新規]をクリックして接続プロパティを入力します。
    4. d[接続]をクリックします。
    4接続を変更するには、次の手順を実行します。
    1. a[接続]の横にある[変更]をクリックします。
    2. b[接続]ページで接続を選択するか、[新規]をクリックして接続プロパティを入力します。
    3. c[接続]をクリックします。
    5プライマリクラウドデータウェアハウスを使用しない場合は、[プライマリクラウドデータウェアハウスがありません]を選択し、[保存]をクリックします。

ランタイム環境の選択

タスクウィザードの開始後に最初に行う必要がある操作は、タスクの定義に必要なソースメタデータとターゲットメタデータの取得に使用するランタイム環境を選択することです。以前にデフォルトランタイム環境を設定した場合、このステップはスキップされます。
注:
事前にAdministratorで1つ以上のSecure Agentを使用して、ランタイム環境が設定されている必要があります。
    1[ランタイム環境の選択]ダイアログボックスで、使用するランタイム環境を選択します。
    以前にAdministratorで定義したランタイム環境をドロップダウンリストから選択します。
    このランタイム環境を、作成するすべてのタスクのデフォルト環境として使用する場合は、[デフォルトとして設定]を選択します。デフォルト環境として使用しない場合は、チェックボックスをオフのままにします。
    2[OK]をクリックします。
    注:
    [開始!]ページでタスク定義の最終処理を行うと、タスクを実行するためのランタイム環境を入力するように求めるメッセージが表示されます。この同じランタイム環境を使用するか、別のランタイム環境を選択することができます。

接続先となる接続の設定

[接続先]ページで、既存の接続先となる接続を選択するか、新しい接続を追加します。
このページには、タスクウィザードまたはAdministratorから事前に定義した接続先となる接続のボックスが表示されます。
注:
新しいウィザードの[接続先]ページから新しい接続を追加するには、事前にAdministratorで少なくとも1つの接続を作成しておく必要があります。
次のいずれかのアクションを実行します。
接続を管理するには、Administratorに移動します。
ヒント:
ウィザードを進めていくと、[保存]をクリックして、ページ上部の生成されたタスク名の下のタスクエントリをデフォルトの場所に保存することができます。ウィザードの最後のページで、タスクのカスタム名と場所を入力できます。

ソース接続の設定

[ソース]ページで、既存のソース接続を選択するか、新しい接続を追加します。
注:
[ソース]ページから新しい接続を追加するには、事前にAdministratorで少なくとも1つの接続を作成しておく必要があります。
次のいずれかのアクションを実行します。

タスクの詳細: ソースからデータをレプリケートする方法の設定

「タスクの詳細」のステップ1で、データソースを設定します。
[ソースのプロパティ]で、必須の基本ソースプロパティを設定します。[ソースオブジェクト]または[ソーステーブル]で、データのレプリケート元となるソースオブジェクトまたはテーブルを選択します。次に、[詳細ソースプロパティ]で、必要に応じてオプションの詳細ソースプロパティを設定します。次のようなソースタイプのプロパティの説明を参照してください。

Adobe Analyticsソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
レポート構成ファイルへのパス
レポート構成を含むJSONファイルへのパス。
[次に]をクリックして、タスクの詳細の手順2に進みます。

Google Analyticsソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。
注:
Google Analytics Mass Ingestionコネクタのサポートは終了しました。Informaticaは、このコネクタに対するバグ修正、機能強化、およびサポートの提供を終了しました。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
アカウントID
Google Analyticsサービスアカウントの一意の識別子を入力します。
プロパティID
データをレプリケートするプロパティの一意の識別子を入力します。
ビューID
データをレプリケートするビューの一意の識別子を入力します。
レポート構成ファイルへのパス
レポート構成を含むJSONファイルへのパス。
[次に]をクリックして、タスクの詳細の手順2に進みます。

Marketoソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
[次に]をクリックして、タスクの詳細の手順2に進みます。

Microsoft Dynamics 365ソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
[次に]をクリックして、タスクの詳細の手順2に進みます。

NetSuiteソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
[次に]をクリックして、タスクの詳細の手順2に進みます。

Oracle Fusion Cloudソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
Oracle Fusionレプリケーションアプローチ
次のいずれかのレプリケーションアプローチを選択します。
  • - ERP、SCM、HCM、Sales、およびServicesなど、Oracle Fusionのさまざまなアプリケーションからデータを抽出し、データをターゲットに転送する場合は、[REST]を選択します。
  • - ソースからターゲットに大量のデータを抽出する場合は、[BICC](Business Intelligence Cloud Connector)を選択します。
Oracle Fusionアプリケーション
データのレプリケーション元のアプリケーションを選択します。
[次に]をクリックして、タスクの詳細の手順2に進みます。

Salesforceソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
Salesforce API
初期ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、ソースデータの取得に使用するSalesforce APIのタイプを選択します。
次のオプションがあります。
  • - 標準(REST)API: Base64データ型のソースフィールドをレプリケートします。データの初期ロード時にBase64データ型のフィールド、またはBulk API 2.0でサポートされていないオブジェクトを取り込む場合を除き、Bulk API 2.0を使用することをお勧めします。すべての増分ロードアクティビティは、標準のREST APIのみを使用します。
  • - Bulk API 2.0: Base64データ型のソースフィールドのレプリケーションを除外します。Bulk API 2.0は、初期ロードタスク、および初期ロードと増分ロードの組み合わせタスクの初期ロードのデフォルトのAPIです。
  • - Bulk API: プライマリキーのチャンキングにBulk API 1.0を使用して、Salesforceで並列処理を実行し、初期ロードジョブ、および初期ロードと増分ロードの組み合わせジョブのパフォーマンスと速度を最適化します。このオプションを使用して、Salesforceからの大量データを処理します。
注:
デフォルトでは、増分ロードタスクは、Base64データ型のソースフィールドから変更データをキャプチャしてレプリケートできます。
[次に]をクリックして、タスクの詳細の手順2に進みます。

Salesforce Marketing Cloudソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
MID
Salesforce Marketing Cloudアカウントに割り当てられた一意のメンバー識別コードを入力します。
[次に]をクリックして、タスクの詳細の手順2に進みます。

SAP OData V2コネクタを使用するSAPソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
ODataサービス名
データの取得元のODataサービスエンドポイントを選択します。
このリストには、特定のSAPサービス、またはSAP OData V2接続で指定したサービスタイプに基づいてSAPゲートウェイで使用可能なすべてのサービスのリストが表示されます。
[次に]をクリックして、タスクの詳細の手順2に進みます。

SAP ODP Extractorコネクタを使用するSAPソースの設定

[ソース]ページで選択したSAP ODP Extractorコネクタを使用して、SAP ECCまたはSAP S4/HANAソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
コンテキスト
ターゲットにレプリケートするソースデータソースを含むコンテキストを選択します。
SAP ODP Extractorコネクタは、すべてのロードタイプに対して次のようなODPプロバイダまたはコンテキストをサポートします。
プロバイダ/コンテキスト
ソースSAPシステムとODP
SAP Service Application Programming Interface(S-API)
Enterprise Search(ESH)なしのSAP Data Sources/SAP Data Extractors
HANA
SAP HANA情報ビュー
BW
SAP NetWeaver Business Warehouse
ABAP_CDS
ABAP Core Data Services
SAP SLT
SLTキュー
[次に]をクリックして、タスクの詳細の手順2に進みます。

SAP Mass Ingestionコネクタを使用するSAPソースの設定

[ソース]ページで選択したSAP Mass Ingestionコネクタを使用して、SAP ECCまたはSAP S4/HANAソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
スキーマ
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合は、ソーステーブルを含んだ基礎となるデータベーススキーマを入力します。スキーマ値を入力するには、次の手順を実行します。
  • - SAPアプリケーションにログインします。
  • - [システム] > [ステータス]を参照します
  • - [所有者]の値を確認します。この値を[スキーマ]フィールドに入力します。
[次に]をクリックして、タスクの詳細の手順2に進みます。

ServiceNowソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
[次に]をクリックして、タスクの詳細の手順2に進みます。

Workdayソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
Workday API
ソースデータの読み取りに使用するWebサービスのタイプを選択します。次のオプションがあります。
  • - SOAP: SOAP APIを使用してWorkdayデータを抽出します。
  • - RaaS: Workday Report-as-a-Service(RaaS)を使用して、カスタムレポートのカスタムオブジェクトとカスタムフィールドからソースデータを抽出します。Workday RaaSは、初期ロードジョブでのみ使用できます。
SOAP APIの使用を選択した場合は、次の手順を実行します。
  1. 1[製品]リストで、[Human Capital Management]を選択します。
  2. 2[サービス]リストで、ターゲットにデータを取り込むHuman Capital Management(HCM)サービスを選択します。
  3. [サービス]リストから複数のサービスを選択することができます。
  4. 3[出力タイプ]リストで、データをターゲットに保存する形式を選択します。
  5. 取り込みジョブは、XML構造でソースデータを抽出します。選択した形式に基づいて、抽出されたデータがJSONまたはXML形式の単一オブジェクトとしてターゲットに書き込まれます。
RaaS APIを使用する場合は、次の手順を実行します。
  1. 1[レポートの数]フィールドで、ソースから抽出するレポートの数を選択します。
  2. 2単一のレポートを抽出する場合は、[レポート名またはURL]フィールドに、ソースから読み取るカスタムレポートの名前またはURLを入力します。
  3. 3複数のレポートを抽出する場合は、[レポート構成ファイル]フィールドに、ソースから読み取るカスタムレポートのリスト用に作成したCSVファイルへのパスを入力します。
[次に]をクリックして、タスクの詳細の手順2に進みます。

Zendeskソースの設定

[ソース]ページで選択したソースのソースプロパティを定義します。

ソースのプロパティ

基本ソースプロパティを設定します。
プロパティ
説明
ロードタイプ
アプリケーション取り込みとレプリケーションタスクで実行するロード操作のタイプ。タスクには、次のロードタイプのいずれかを選択できます。
  • - 初期ロード: 特定の時点で読み取られたデータを、バッチ操作でソースアプリケーションからターゲットにロードします。初期ロードを実行して、増分変更データの送信先となるターゲットをマテリアライズできます。
  • - 増分ロード: ソースデータの変更を継続的に、またはジョブが停止または終了するまでターゲットにプロパゲートします。ジョブは、ジョブが最後に実行されてから、または最初のジョブ実行の特定の開始点から発生した変更をプロパゲートします。
  • - 初期ロードと増分ロード: ターゲットへのポイントインタイムデータの初期ロードを実行してから、同じソースオブジェクトに対して継続的に行われた増分データ変更のプロパゲートに自動的に切り替わります。
[次に]をクリックして、タスクの詳細の手順2に進みます。

タスクの詳細: ターゲットにデータをレプリケートする方法の設定

タスクの詳細の手順2でデータターゲットを設定します。
    bullet[ターゲットプロパティ]で、必須の基本ターゲットプロパティを設定します。次に、ページ上部の[詳細オプションを表示]をオンにして、必要に応じてオプションの詳細ターゲットプロパティを設定します。次のようなターゲットタイプのプロパティの説明を参照してください。

Amazon Redshiftターゲットの設定

Amazon Redshift宛先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のAmazon Redshiftターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソースオブジェクトをベースにしてターゲットテーブルを生成します。
スキーマ
アプリケーション取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
    注:
    [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。
注:
[監査]および[論理削除]適用モードは、SAP Mass Ingestionコネクタを使用したSAPソースでのみ使用できます。
デフォルト値は[標準]です。
バケット
Amazon Redshiftにロードするデータオブジェクトへのアクセスを保存、整理、および制御するAmazon S3のバケットコンテナの名前。
データディレクトリまたはタスクターゲットディレクトリ
アプリケーション取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Amazon S3ターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のAmazon S3ターゲットプロパティを定義します。
プロパティ
説明
オープンテーブルフォーマット
Amazon S3ストレージにデータをレプリケートするためにオープンテーブル形式を使用するかどうかを制御します。
次のいずれかのオプションを選択します。
  • - Apache Iceberg。データをApache IcebergテーブルとしてAmazon S3クラウドストレージにレプリケートします。これらのテーブルには、AWS Glue Catalogを使用してAmazon S3から直接アクセスできます。
  • - なし。オープンテーブル形式を使用しません。
デフォルト値は[なし]です。
名前空間
Apache Icebergオープンテーブル形式を使用する場合は、Apache Icebergテーブルを保存および管理するデータベースの名前をAWS Glueカタログに入力してください。
出力形式
出力ファイルの形式。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
ウェアハウスベースディレクトリ
Apache Icebergオープンテーブル形式を使用する場合は、ターゲットファイルとターゲットテーブルを保存するAmazon S3のルートディレクトリを入力してください。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、アプリケーション取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
暗号化タイプ
Amazon S3ターゲットに書き込まれる出力ファイルの暗号化タイプを選択します。次のオプションがあります。
  • - なし
  • - クライアントサイドの暗号化
  • - KMSを使用したクライアントサイドの暗号化
  • - サーバーサイドの暗号化
  • - KMSを使用したサーバーサイドの暗号化
注:
[クライアントサイドの暗号化]または[KMSを使用したクライアントサイドの暗号化]を使用した場合、暗号化および復号されるファイルの最大サイズは64GBです。
デフォルト値は[なし]で、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
データディレクトリ
初期ロードタスクの場合、アプリケーション取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
デフォルトのディレクトリパターンは{TableName)_{Timestamp}です。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
例:
myDir1/{SchemaName}/{TableName}
myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp}
myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3およびMicrosoft Azure Data Lake Storage Gen2ターゲットでは、[親としての接続ディレクトリ]が選択されている場合、アプリケーション取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、アプリケーション取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
親としての接続ディレクトリ
オープンテーブル形式を使用する場合は、このチェックボックスをオンにして、ターゲット接続プロパティで指定したディレクトリ値を親ディレクトリとして使用します。このパスは、ファイル作成時にS3のファイルパスに追加されます。このチェックボックスはデフォルトで選択されています。
例えば、接続に設定されたS3ディレクトリがmyFolderOnS3/F1で、[ウェアハウスベースディレクトリ]/myFoldの場合、ファイルはmyFolderOnS3/F1/myFold/<ファイル>に保存されます。ただし、[親としての接続ディレクトリ]オプションを選択していない場合、ファイルは直接/myFold/<ファイル>に保存されます。
オープンテーブル形式を使用しない場合、このチェックボックスをオンにすると、ターゲット接続プロパティで指定したディレクトリ値が、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用されます。初期ロードタスクの場合、親ディレクトリは、データディレクトリスキーマディレクトリで使用されます。増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリスキーマディレクトリサイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。
このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Databricksターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のDatabricksターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソースオブジェクトをベースにしてターゲットテーブルを生成します。
スキーマ
アプリケーション取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 論理削除を有効にした後、ノーマルモードまたはバックログモードでソーステーブルを更新すると、一致するレコードが削除され、更新されたレコードが挿入されて、ターゲットテーブルでINFA_OPERATION_TYPE操作がNULLとしてマークされます。同様に、バックログモード中にソーステーブルにレコードを挿入すると、ターゲットテーブルレコードでINFA_OPERATION_TYPE操作がEとしてマークされます。
    処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、トランザクションID、前のイメージなどの変更に関するメタデータが含まれています。監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
  • 監査適用モードを有効にした後、バックログモードまたはノーマルモード中にソーステーブルを更新すると、ターゲットテーブルレコードでINFA_OPERATION_TYPE操作がEとしてマークされます。同様に、バックログモード中にソーステーブルにレコードを挿入すると、ターゲットテーブルレコードでINFA_OPERATION_TYPE操作がEとしてマークされます。
デフォルトは[標準]です。
データディレクトリまたはタスクターゲットディレクトリ
アプリケーション取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Google BigQueryターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のGoogle BigQueryターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソースオブジェクトをベースにしてターゲットテーブルを生成します。
スキーマ
アプリケーション取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
    注:
    [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。
デフォルト値は[標準]です。
バケット
Google Cloud Storageにロードするデータオブジェクトへのアクセスを保存、整理、および制御する既存のバケットコンテナの名前。
データディレクトリまたはタスクターゲットディレクトリ
アプリケーション取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Google Cloud Storageターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のGoogle Cloud Storageターゲットプロパティを定義します。
プロパティ
説明
出力形式
出力ファイルの形式。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、アプリケーション取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
バケット
Google Cloud Storageにロードするデータオブジェクトへのアクセスを保存、整理、および制御する既存のバケットコンテナの名前。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
データディレクトリ
初期ロードタスクの場合、アプリケーション取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
デフォルトのディレクトリパターンは{TableName)_{Timestamp}です。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
例:
myDir1/{SchemaName}/{TableName}
myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp}
myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3およびMicrosoft Azure Data Lake Storage Gen2ターゲットでは、[親としての接続ディレクトリ]が選択されている場合、アプリケーション取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、アプリケーション取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Kafkaターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のKafkaターゲットプロパティを定義します。
プロパティ
説明
テーブル名をトピック名として使用
アプリケーション取り込みとレプリケーションが、ソースデータを含むメッセージをソースオブジェクトごとに1つずつ個別のトピックに書き込むか、すべてのメッセージを1つのトピックに書き込むかを制御します。
テーブル固有のトピックを区切るメッセージを書き込むには、このチェックボックスを選択します。トピック名は、[スキーマ名を含める][テーブルプレフィックス]、または[テーブルサフィックス]プロパティに追加しない限り、トピック名はソーステーブル名に一致します。
デフォルトでは、このチェックボックスはオフです。
スキーマ名を含める
[テーブル名をトピック名として使用]が選択されている場合、このチェックボックスが表示され、デフォルトで選択されています。この設定により、テーブル固有のトピック名にソーススキーマ名が追加されます。トピック名の形式は次のとおりです。スキーマ名_テーブル名
スキーマ名を含めない場合は、このチェックボックスをオフにします。
テーブルプレフィックス
テーブル名をトピック名として使用を選択すると、このプロパティが表示され、オプションでプレフィックスを入力してテーブル固有のトピック名に追加できます。例えば、myprefix_を指定すると、トピック名の形式は「myprefix_テーブル名」になります。プレフィックスの後のアンダースコア(_)を省略すると、プレフィックスがテーブル名の前に追加されます。
テーブルサフィックス
テーブル名をトピック名として使用を選択すると、このプロパティが表示され、オプションでサフィックスを入力してテーブル固有のトピック名に追加できます。例えば、_mysuffixを指定すると、トピック名の形式は「テーブル名_mysuffix」になります。サフィックスの前のアンダースコア(_)を省略すると、サフィックスがテーブル名に追加されます。
出力形式
出力ファイルの形式を選択します。次のオプションがあります。
  • - CSV
  • - AVRO
  • - JSON
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
KafkaターゲットがConfluent Schema Registryを使用して増分ロードジョブのスキーマを格納する場合は、形式として[AVRO]を選択する必要があります。
JSON形式
出力形式として[JSON]が選択されている場合は、出力の詳細レベルを選択します。次のオプションがあります。
  • - 簡潔。この形式では、操作タイプやカラムの名前と値など、最も関連性の高いデータのみが出力に記録されます。
  • - 詳細。この形式では、テーブル名やカラムタイプなどの詳細情報が記録されます。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式としてAVROが選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - Binary
  • - JSON
  • - なし
デフォルト値は[Binary]です。
Confluent Schema Registryを使用してスキーマを格納するConfluent Kafkaターゲットがある場合は、[なし]を選択します。それ以外の場合、Confluent Schema Registryはスキーマを登録しません。Confluent Scheme Registryを使用していない場合、[なし]は選択しないでください。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ソーススキーマの変更によってターゲットが変更されることが予想される場合、Avroスキーマ定義ファイルは、タイムスタンプを含む一意の名前で次の形式で再生成されます。
schemaname_tablename_YYYYMMDDhhmmss.txt
この一意の命名パターンにより、古いスキーマ定義ファイルが監査目的で保持されます。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft Azure Data Lake Storage Gen2ターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のMicrosoft Azure Data Lake Storage Gen2ターゲットプロパティを定義します。
プロパティ
説明
出力形式
出力ファイルの形式。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、アプリケーション取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
データディレクトリ
初期ロードタスクの場合、アプリケーション取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
デフォルトのディレクトリパターンは{TableName)_{Timestamp}です。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
例:
myDir1/{SchemaName}/{TableName}
myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp}
myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3およびMicrosoft Azure Data Lake Storage Gen2ターゲットでは、[親としての接続ディレクトリ]が選択されている場合、アプリケーション取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、アプリケーション取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
親としての接続ディレクトリ
ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスをオンにします。
初期ロードタスクの場合、親ディレクトリは、データディレクトリスキーマディレクトリで使用されます。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリスキーマディレクトリサイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。
このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft Azure Synapse Analyticsターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のMicrosoft Azure Synapse Analyticsターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソースオブジェクトをベースにしてターゲットテーブルを生成します。
スキーマ
アプリケーション取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。接続プロパティで指定されたスキーマ名がデフォルトで表示されます。
このフィールドは大文字と小文字が区別されます。そのため、接続プロパティのスキーマ名が適切な大文字小文字表記で入力されていることを確認してください。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft Fabric OneLakeターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のMicrosoft Fabric OneLakeターゲットプロパティを定義します。
プロパティ
説明
オープンミラーリング
Microsoft Fabricオープンミラーリングを使用するには、このチェックボックスを選択します。オープンミラーリングにより、ソースデータの同期されたほぼリアルタイムのコピーを、Parquet形式でMicrosoft Fabric OneLakeに作成します。詳細については、Microsoft Fabric OneLakeにデータをレプリケートするためのオープンミラーリングの使用を参照してください。
注:
オープンミラーリングを有効にする前に、出力形式として[Parquet]を選択してから、オープンミラーリングの設定を続行するようにしてください。
ランディングゾーンのURL。
[オープンミラーリング]を選択した場合は、ミラーリングされたデータファイルがMicrosoft Fabricで処理される前にParquet形式で保存される、固有のMicrosoft Fabric OneLakeパスを入力します。
注:
オープンミラーリングを有効にすると、このテーブルのその他の項目は適用されなくなります。
出力形式
出力ファイルの形式を選択します。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
注:
オープンミラーリングはParquet出力形式を使用します。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、アプリケーション取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
データディレクトリ
初期ロードタスクの場合、アプリケーション取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
デフォルトのディレクトリパターンは{TableName)_{Timestamp}です。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
例:
myDir1/{SchemaName}/{TableName}
myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp}
myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3およびMicrosoft Azure Data Lake Storage Gen2ターゲットでは、[親としての接続ディレクトリ]が選択されている場合、アプリケーション取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、アプリケーション取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft SQL Serverターゲットの設定

Microsoft SQL Serverターゲットプロパティの定義

ターゲットプロパティ

次の必須のMicrosoft SQL Serverターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
[ターゲットテーブルの作成]オプションは、ソーステーブルに基づいてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、アプリケーション取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。アプリケーション取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
アプリケーション取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。接続プロパティで指定されたスキーマ名がデフォルトで表示されます。
このフィールドは大文字と小文字が区別されます。そのため、接続プロパティのスキーマ名が適切な大文字小文字表記で入力されていることを確認してください。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Oracle Cloud Object Storageターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のOracle Cloud Object Storageターゲットプロパティを定義します。
プロパティ
説明
出力形式
出力ファイルの形式。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、アプリケーション取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
親としての接続ディレクトリ
ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスをオンにします。
初期ロードタスクの場合、親ディレクトリは、データディレクトリスキーマディレクトリで使用されます。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリスキーマディレクトリサイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。
このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。
データディレクトリ
初期ロードタスクの場合、アプリケーション取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
デフォルトのディレクトリパターンは{TableName)_{Timestamp}です。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
例:
myDir1/{SchemaName}/{TableName}
myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp}
myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3およびMicrosoft Azure Data Lake Storage Gen2ターゲットでは、[親としての接続ディレクトリ]が選択されている場合、アプリケーション取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、アプリケーション取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Oracleターゲットの設定

Oracle宛先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のOracleターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソースオブジェクトをベースにしてターゲットテーブルを生成します。
スキーマ
アプリケーション取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
注:
[監査]適用モードは、SAP Mass Ingestionコネクタを使用したSAPソースに適用されます。
デフォルト値は[標準]です。
[次へ]をクリックして次に進むか、[保存]をクリックします。

PostgreSQLターゲットの設定

PostgreSQL出力先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のPostgreSQLターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソースオブジェクトをベースにしてターゲットテーブルを生成します。
スキーマ
アプリケーション取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Snowflake Data Cloudターゲットの設定

Snowflake出力先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のSnowflakeターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソースオブジェクトをベースにしてターゲットテーブルを生成します。
スキーマ
アプリケーション取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
ステージ
データがターゲットテーブルに書き込まれる前にソースから読み取られたデータを保持する内部ステージング領域の名前。この名前にスペースを含めることはできません。指定されたステージング領域が存在しない場合、自動的に作成されます。
注:
[詳細ターゲットプロパティ]で[Superpipe]オプションを選択した場合、このフィールドは使用できません。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 論理削除を有効にした後、ノーマルモードまたはバックログモードでソーステーブルを更新すると、一致するレコードが削除され、更新されたレコードが挿入されて、ターゲットテーブルでINFA_OPERATION_TYPE操作がNULLとしてマークされます。同様に、バックログモード中にソーステーブルにレコードを挿入すると、ターゲットテーブルレコードでINFA_OPERATION_TYPE操作がEとしてマークされます。
    処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、トランザクションID、前のイメージなどの変更に関するメタデータが含まれています。監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
  • 監査適用モードを有効にした後、バックログモードまたはノーマルモード中にソーステーブルを更新すると、ターゲットテーブルレコードでINFA_OPERATION_TYPE操作がEとしてマークされます。同様に、バックログモード中にソーステーブルにレコードを挿入すると、ターゲットテーブルレコードでINFA_OPERATION_TYPE操作がEとしてマークされます。
    注:
    [監査]適用モードは、SAP Mass Ingestionコネクタを使用したSAPソースに適用されます。
デフォルトは[標準]です。
[次へ]をクリックして次に進むか、[保存]をクリックします。

データの変換

選択したテーブルとカラムにトリムトランスフォーメーションを適用して、文字カラムの値の左または右のスペースを削除できます。また、行レベルのフィルタルールを定義して、データがターゲットに適用される前に、定義したカラムの条件に基づいてソーステーブルのデータ行をフィルタで除外することもできます。
注:
デプロイされたジョブのタスクで行レベルのフィルタを編集した場合、更新したフィルタを有効にするには、編集後にジョブを再デプロイする必要があります。
    1[データの変換]ページで、トランスフォーメーションを割り当てるテーブルとカラムを選択します。
    注:
    トリムトランスフォーメーションと行レベルのフィルタは、同じテーブルとカラムに適用することができます。
    2トリムトランスフォーメーションを追加するには、[トランスフォーメーションの追加]をクリックします。
    [データの変換方法]ダイアログボックスが表示されます。
    3+(新しい行の追加)アイコンをクリックして、行を追加します。次に、[トランスフォーメーションタイプ]リストで、次のいずれかのオプションを選択します。
    [保存]アイコンをクリックして、エントリを追加します。
    4[次へ]をクリックすると、[サマリ]タブに移動し、トランスフォーメーション設定を確認することができます。
    5[サマリ]タブの設定が適切である場合は、[保存]をクリックして設定を保存し、最初の[データの変換]ページに戻ります。
    6別のテーブルまたはテーブルのセットに別のトランスフォーメーションタイプを追加するには、手順1から5を繰り返します。
    ヒント:
    トランスフォーメーションの割り当ては、[データの変換]ページで削除することができます。不要なトランスフォーメーションを含むテーブルを選択し、[すべてクリア]をクリックします。
    7選択したテーブルとカラムに行レベルのフィルタを追加するには、[トランスフォーメーションの追加]の横にある下矢印をクリックし、[行フィルタの追加]を選択します。
    [行フィルタの追加]オプションは、SAPソース(OracleまたはHANAデータベースを使用)を持ちSAP Mass Ingestionコネクタを使用するか、または Salesforceソースを持ちSalesforce Mass Ingestionコネクタを使用するアプリケーション取り込みとレプリケーションタスクでのみ使用できます。タスクは任意のロードタイプを使用できます。
    行レベルのフィルタをテーブルとカラムに追加するための、[行フィルタの追加]オプションを選択します。
    [データをフィルタリングするための条件]ダイアログボックスが表示されます。
    8フィルタ条件を適用するテーブルとフィルタのタイプを選択します。
    1. a以前に選択したテーブルのセットから、フィルタを割り当てるテーブルを選択します。
    2. b以下のフィルタタイプのいずれか1つを選択してください。
    3. デフォルトのオプションは[基本]です。
    9[基本]フィルタを追加するには、次の手順を実行します。
    1. a+(新しい行の追加)アイコンをクリックして、行を追加します。
    2. b[カラム名]で、カラムを選択します。
    3. 行のフィルタリングでサポートされていないデータ型のカラムには、「サポートされていません」というマークが表示されます。
    4. c[演算子]で、値に使用する演算子のタイプを選択します。
    5. d[値]で、カラムのタイプに応じて値を選択するか入力します。次に、行の右端にある[保存}アイコンをクリックして条件を保存します。
    6. 次のテーブルに、フィルタリングでサポートされているそれぞれのカラムのデータ型に有効な値について説明します。
      カラムのデータタイプ
      説明
      INTEGER
      数値を入力してください。「+」と「-」は、数字の前に一度だけ使用することができます。値は、-2147483648~2147483647文字の範囲にする必要があります。
      Long
      数値を入力してください。「+」と「-」は、数字の前に一度だけ使用することができます。値は、-9,223,372,036,854,775,808~9,223,372,036,854,775,807文字の範囲にする必要があります。
      BIGINT
      数値を入力してください。「+」と「-」は、数字の前に一度だけ使用することができます。最大長は50桁です。
      BIGDEC
      数値を入力してください。「+」と「-」は、数字の前に一度だけ使用することができます。10進数を使用することができます。最大長は50桁です。
      STRING
      テキストを入力します。
      DATE
      日付ピッカーを使用して日付を選択します。
      TIME
      値はHH:MM:SS.MSの形式で入力します(ミリ秒はオプションで、最大長は9桁です)。
      例: 13:14:15.123456789
      DATETIME
      日付ピッカーを使用して、日付と時刻を選択します。
      OFFSET_DATETIME
      日付ピッカーを使用して、日付、時刻、およびタイムゾーンを選択します。
      注:
      アプリケーション取り込みとレプリケーションでは、BOOLEAN、BINARY、BLOB、CLOB、およびグラフィックカラムのデータ型はサポートされていません。
    7. e指定した条件の構文をテストするには、[検証]をクリックします。
    8. f別の基本条件を追加するには、手順aからeを繰り返します。
    9. AND演算子は、複数の条件を組み合わせる場合に使用します。
    10. g変更を検証して保存するには、[保存]をクリックします。
    11. h基本フィルタ条件の定義が完了した後に、[OK]をクリックして[データの変換]ページに戻ります。
    10ANDまたはOR演算子を使用して組み合わせた複数の条件で構成される[詳細]フィルタを定義するには、ボックスに条件を手動で入力します。
    注:
    カラムに基本フィルタ条件を入力した後に詳細フィルタに切り替えた場合は、基本条件が表示されるため、その条件に追加を行うことで、より複雑なフィルタを作成することができます。
    1. a[カラム名]でカラムを選択し、「>」矢印をクリックします。
    2. カラム名が[フィルタ条件]ボックスに表示されます。
      注:
      組み合わせロードタスクの場合は、CDC処理中に更新される可能性があるカラムを含めないようにしてください。カラムが更新されるとレプリケーションに適した状態ではなくなるため、予期しない結果が生じる可能性があります。この場合は、ジョブを再同期する必要があります。
    3. b[フィルタ条件]ボックスに、選択したカラムに対する1つ以上の条件を入力します。サポートされている構文と適切な演算子(カラムのデータ型に応じて異なる場合があります)を使用して、条件を手動で入力します。条件は丸括弧を使用してネストすることもできます。行レベルのフィルタリングの構文を参照してください。完了した後に、行の右端にある[保存]アイコンをクリックして詳細フィルタを保存します。
    4. 次のテーブルに、フィルタリングでサポートされているそれぞれのカラムのデータ型に有効な値について説明します。
      カラムのデータタイプ
      説明
      INTEGER
      数値を入力してください。「+」と「-」は、数字の前に一度だけ使用することができます。値は、-2147483648~2147483647文字の範囲にする必要があります。
      Long
      数値を入力してください。「+」と「-」は、数字の前に一度だけ使用することができます。値は、-9,223,372,036,854,775,808~9,223,372,036,854,775,807文字の範囲にする必要があります。
      BIGINT
      数値を入力します。「+」と「-」は、数字の前に一度だけ使用することができます。最大長は50桁です。
      BIGDEC
      数値を入力してください。「+」と「-」は、数字の前に一度だけ使用することができます。10進数を使用することができます。最大長は50桁です。
      STRING
      入力属性を一重引用符(')で囲んで入力します。
      DATE
      値をYYYY-MM-DDの形式で入力します。入力属性を一重引用符(')で囲んで入力します。
      TIME
      値をHH:MM:SS.MSの形式で入力します(ミリ秒(MS)はオプションで、最大長は9桁です)。入力属性を一重引用符(')で囲んで入力します。
      例: 13:14:15.123456789
      DATETIME
      以下の形式で日付と時刻を入力します。
      YYYY-MM-DDTHH:MM:SS:MS
      例: 2024-12-31T03:04:05.123456789
      入力属性を一重引用符(')で囲んで入力します。
      OFFSET_DATETIME
      日付、時刻、およびタイムゾーンを次の形式で入力します。
      YYYY-MM-DDTHH:MM:SS.MS+05:00
      例: 2024-03-15T10:03:04.123456789+05:00
      入力属性を一重引用符(')で囲んで入力します。
      注:
    5. c指定した条件の構文をテストするには、[検証]をクリックします。
    6. 注:
      詳細フィルタ条件を作成または編集した後に[詳細]フィルタタイプから[基本]フィルタタイプに切り替えると、保存を行った場合でも、フィルタ条件に対する変更内容はすべて削除されます。
    7. d変更を検証して保存するには[保存]をクリックし、[OK]をクリックして[データの変換]ページに戻ります。
    8. 注:
      タスクのデプロイ後に、フィルタに含まれるカラムを変更しないようにしてください。この操作を行うと、行レベルのフィルタリングが適切に機能しなくなる可能性があります。
    [データの変換]ページの[フィルタ]カラムに、適用されたフィルタがハイパーリンクとして表示されます。リンクをクリックすると、選択したフィルタが編集モードで開きます。詳細フィルタが設定されたテーブルには、[フィルタ]カラムのフィルタ条件の横に[詳細]と表示されます。
    [データの変換]ページで、右上隅にある[すべてクリア]ボタンをクリックすると、トリムトランスフォーメーションや行レベルのフィルタを含むすべてのフィルタが、選択したテーブルから削除されます。
    11完了した後に、[次に]をクリックします。

行レベルのフィルタリングの構文

アプリケーション取り込みとレプリケーションタスクを定義するときに行レベルの詳細フィルタを作成する場合は、正しい構文を使用してフィルタ条件を入力してください。正しい構文を使用してフィルタ条件が入力されていない場合、フィルタの検証が失敗する可能性があります。
演算子
詳細フィルタでは、カラムのデータ型に応じて、条件内で次のような演算子を使用することができます。
演算子
説明
=
等しい
! =
次の値に等しくない
>
より大きい
>=
以上
<
より小さい
<=
以下
IS NULL
NULLを含む
IS NOT NULL
NULLを含まない
BETWEEN x AND y
x以上で、y以下
NOT BETWEEN %s AND %s
x未満で、yを超える
LIKE
文字列カラムのみの比較演算子。
例: LIKE '%06%7__' 。この条件は、06789、A06X789、AB06XY789"、"06X789、およびA06789の値と一致します。ただし、A06789Z、A0678、A6789、""の値とは一致しません。
NOT LIKE
文字列カラムのみの比較演算子。
IN
オペランドが式のリストのいずれか1つと等しい場合はTrue
NOT IN
オペランドが式のリストのいずれか1つと等しくない場合はTrue
+ - / *
加算、減算、除算、乗算の数値計算演算子
構文ルール
詳細フィルタでは、次の構文ルールとともに使用します。

タスク定義の最終処理

ほぼ完了です! [開始!]ページで、さらにいくつかのプロパティの入力を完了します。次に、タスクを保存してデプロイすることができます。
    1[全般プロパティ]で、次のプロパティを設定します。
    プロパティ
    説明
    タスク名
    生成された名前を使用しない場合は、アプリケーション取り込みとレプリケーションタスクの識別に使用する名前を入力します。わかりやすい名前を使用すると、後でタスクを見つけやすくなります。
    タスク名には、ラテン英数字、スペース、ピリオド(.)、コンマ(,)、アンダースコア(_)、プラス記号(+)、およびハイフン(-)を含めることができます。タスク名に他の特殊文字を含めることはできません。タスク名では大文字と小文字が区別されません。最大長は50文字です。
    注:
    タスク名にスペースを含めた場合、タスクのデプロイ後、対応するジョブ名にはスペースが表示されません。
    場所
    タスク定義を含むExplore内のプロジェクトまたはプロジェクト\フォルダ。プロジェクトを指定しない場合は、「デフォルト」のプロジェクトが使用されます。
    ランタイム環境
    タスクの実行に使用するランタイム環境を選択します。デフォルトでは、タスクの定義を開始したときに最初に入力したランタイム環境が表示されます。このランタイム環境を使用するか、別のランタイム環境を選択することができます。
    ヒント:
    ランタイム環境のリストを更新するには、[更新]をクリックします。
    ランタイム環境は、1つ以上のSecure Agentで構成されるSecure Agentグループにすることができます。Secure Agentは、タスクを実行し、安全な通信を可能にする軽量のプログラムです。
    または、一部のソースタイプを持つアプリケーション取り込みとレプリケーションの初期ロードジョブでは、Microsoft Azureでホストされているサーバーレスランタイム環境を使用できます。
    注:
    以前にローカルランタイム環境を選択していた場合、サーバーレスランタイム環境を選択することはできません。
    クラウドホステッドエージェントはサポートされていません。
    指定したランタイム環境を、作成するすべてのタスクのデフォルト環境として使用するには、[デフォルトとして設定]を選択します。デフォルト環境として使用しない場合は、このチェックボックスをオフのままにします。
    説明
    必要に応じて、タスクに使用する説明を入力します。
    最大長は4,000文字です。
    スケジュール
    手動で開始するのではなく、スケジュールに基づいて初期ロードタスクを実行する場合は、[このタスクは指定したスケジュールを使用する]を選択します。次に、事前にAdministratorで定義したスケジュールを選択します。
    デフォルトのオプションは[このタスクはスケジュールを使用しない]です。
    注:
    このフィールドは、増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクには使用できません。
    スケジュールオプションを表示および編集するには、Administratorに移動します。スケジュールを編集すると、変更はスケジュールを使用するすべてのジョブに適用されます。タスクのデプロイ後にスケジュールを編集する場合、タスクを再デプロイする必要はありません。
    ジョブを実行するためのスケジュール条件を満たしていて、前のジョブ実行がまだアクティブである場合、アプリケーション取り込みとレプリケーションは新しいジョブの実行をスキップします。
    タスクフローで実行
    このチェックボックスを選択すると、タスクをデータ統合でイベントソースとしてタスクフローに追加できるようになります。その後、取り込んだデータを変換するトランスフォーメーションをタスクフローに含めることができます。[Superpipe]オプションを使用しないSnowflakeターゲットを持つ初期ロードタスクおよび増分ロードタスクで使用できます。
    2詳細プロパティを表示するには、[詳細オプションを表示]をオンに切り替えます。
    3必要に応じて、[出力ファイル内の行数]の値を編集して、アプリケーション取り込みとレプリケーションタスクが出力ファイルに書き込む行の最大数を指定します。
    注:
    Apache Kafkaターゲットを持つジョブの場合、またはSnowflakeターゲットにSuperpipeオプションを使用している場合、[出力ファイル内の行数]フィールドは表示されません。
    有効な値は1から100000000です。Amazon S3、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Infrastructure(OCI)Object Storageターゲットのデフォルト値は1000行です。その他のターゲットの場合は、デフォルト値は100000行です。
    注:
    増分ロード操作と、初期ロード操作と増分ロード操作の組み合わせの場合、指定した行数に達したとき、またはフラッシュ待ち時間が経過して、トランザクションの処理の途中でジョブが実行されない場合に、変更データがターゲットにフラッシュされます。フラッシュ待ち時間は、ジョブがデータをターゲットにフラッシュする前に、さらに変更データを待機する時間です。待ち時間は10秒に設定されており、変更できません。
    4初期ロードジョブの場合のみ、Amazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage、またはMicrosoft Fabric OneLakeターゲットの出力データファイルに.dat拡張子を付ける場合は、必要に応じて[ファイルタイプに基づくファイル拡張子]チェックボックスをクリアします。このチェックボックスはデフォルトで選択されており、出力ファイルのファイルタイプに基づいてファイル名拡張子が付けられます。
    注:
    これらのターゲットタイプの増分ロードジョブの場合、このオプションは使用できません。アプリケーション取り込みとレプリケーションは、常にファイルタイプに基づいて出力ファイル名拡張子を使用します。
    5必要に応じて、適用サイクルを設定します。適用サイクルとは、変更データを適用するサイクルであり、ソースの中間データを取得する処理から始まって、ターゲットにデータをコミットして終わります。連続レプリケーションの場合、ソースは待ち時間の短い複数の適用サイクルでデータを処理します。
    Amazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen2、またはMicrosoft Fabric OneLakeターゲットを持つアプリケーション取り込みとレプリケーションの増分ロードタスクの場合、次の適用サイクルオプションを設定できます。
    オプション
    説明
    サイクル間隔の適用
    アプリケーション取り込みとレプリケーションジョブが適用サイクルを終了するまでに経過する必要のある時間を指定します。日、時間、分、秒を指定するか、これらの時間フィールドのサブセットに値を指定して、他のフィールドを空白のままにすることができます。
    デフォルト値は15分です。
    注:
    Amazon S3ターゲットを[オープンテーブル形式]ターゲットプロパティで[Apache Iceberg]オプションとともに使用している場合、このフィールドは無視されます。
    サイクル変更制限の適用
    アプリケーション取り込みとレプリケーションジョブが適用サイクルを終了するまでに処理する必要のあるレコード数を指定します。このレコード制限に達すると、取り込みジョブは適用サイクルを終了し、変更データをターゲットに書き込みます。
    デフォルト値は10000レコードです。
    起動中に、古いデータのバックログの処理の遅れを取り戻す必要がある場合、ジョブは適用サイクル間隔よりも頻繁にこの制限に達する可能性があります。
    注:
    Amazon S3ターゲットを[オープンテーブル形式]ターゲットプロパティで[Apache Iceberg]オプションとともに使用している場合、このフィールドは無視されます。
    低アクティビティのフラッシュ間隔
    アプリケーション取り込みとレプリケーションジョブが適用サイクルを終了する前に、ソースで変更アクティビティがない期間中に経過する必要がある時間を時間、分、またはその両方で指定します。この時間制限に達すると、取り込みジョブは適用サイクルを終了し、変更データをターゲットに書き込みます。
    このオプションの値を指定しない場合、アプリケーション取り込みとレプリケーションジョブは、[サイクル変更制限の適用]または[サイクル間隔の適用]のいずれかの制限に達した後にのみ適用サイクルを終了します。
    デフォルト値は指定されていません。
    注:
    6Apache Kafkaターゲットを持つ増分ロードジョブの場合は、次のチェックポイントオプションを設定します。
    オプション
    説明
    チェックポイントのすべての行
    アプリケーション取り込みとレプリケーションジョブが、Kafkaターゲットに送信されるすべてのメッセージに対してチェックポイント処理を実行するかどうかを示します。
    注:
    このチェックボックスが選択されている場合、[チェックポイントすべてのコミット]、[チェックポイントの行数]、および[チェックポイントの頻度(秒)]オプションは無視されます。
    チェックポイントのすべてのコミット
    アプリケーション取り込みとレプリケーションジョブが、ソースで発生するすべてのコミットに対してチェックポイント処理を実行するかどうかを示します。
    チェックポイントの行数
    チェックポイントを追加する前に、アプリケーション取り込みとレプリケーションジョブがターゲットに送信するメッセージの最大数を指定します。このオプションを0に設定すると、ジョブはメッセージの数に基づいてチェックポイント処理を実行しません。このオプションを1に設定すると、ジョブは各メッセージにチェックポイントを追加します。
    チェックポイントの頻度(秒)
    アプリケーション取り込みとレプリケーションジョブがチェックポイントを追加するまでに経過する必要がある最大秒数を指定します。このオプションを0に設定すると、アプリケーション取り込みとレプリケーションは経過時間に基づいてチェックポイント処理を実行しません。
    7[スキーマドリフトオプション]で、スキーマドリフトの検出がソースとターゲットの組み合わせでサポートされている場合は、サポートされている各タイプのDDL操作に使用するスキーマドリフトオプションを指定します。
    注:
    [スキーマドリフトオプション]セクションは、増分ロードタスクおよび初期ロードと増分ロードの組み合わせタスクに対してのみ表示されます。さらに、このセクションは、スキーマ変更の自動検出をサポートするソースに対してのみ表示されます。
    次の表に、DDL操作タイプに設定できるスキーマドリフトオプションを示します。
    オプション
    説明
    無視
    ソースデータベースで発生するDDLの変更をターゲットにレプリケートしません。
    レプリケート
    アプリケーション取り込みとレプリケーションジョブによるターゲットへのDDLの変更のレプリケートを許可します。
    注:
    • - プライマリキーフィールドを追加するフィールドの追加操作はサポートされておらず、予期しない結果を引き起こす可能性があります。
    • - フィールドのNULLまたはNOT NULL制約を変更するフィールドの変更操作は、ターゲットにレプリケートされません。
    サポートされているDDL操作のタイプは次のとおりです。
    • - カラムの追加
    • - カラムの変更
    • - カラムの削除
    • - カラム名の変更
    アプリケーション取り込みとレプリケーションジョブは、Google BigQueryターゲットのカラムの変更または名前変更、およびOracleターゲットのカラムの追加をサポートしていません。
    ジョブの停止
    アプリケーション取り込みとレプリケーションジョブを停止します。
    テーブルの停止
    DDL変更が発生したソースオブジェクトの処理を停止します。
    注:
    1つ以上のオブジェクトが[オブジェクトを停止]スキーマドリフトオプションによってレプリケーションから除外された場合、ジョブのステータスが[実行中(警告あり)]に変わります。アプリケーション取り込みとレプリケーションジョブは、ジョブが変更の処理を停止した後にソースオブジェクトで発生したデータ変更を取得できません。このアクションにより、ターゲットでデータ損失が発生します。データの損失を回避するには、アプリケーション取り込みとレプリケーションジョブを再開する前に、ジョブが処理を停止したソースオブジェクトとターゲットオブジェクトを再同期する必要があります。
    8[カスタムプロパティ]で、特別な要件を満たすためにInformaticaが提供する1つ以上のカスタムプロパティを指定できます。プロパティを追加するには、[プロパティの作成]フィールドにプロパティの名前と値を入力します。次に、[プロパティの追加]をクリックします。
    これらのプロパティを指定する場合は、Informaticaグローバルカスタマサポートにお問い合わせください。通常、これらのプロパティは、固有の環境または特別な処理のニーズに対応します。必要に応じて、複数のプロパティを指定できます。プロパティ名には、英数字と次の特殊文字のみを含めることができます: ピリオド(.)、ハイフン(-)、およびアンダースコア(_)
    9[保存]をクリックしてタスクを保存します。
    10タスクのジョブインスタンスをデプロイするには[デプロイ]をクリックし、タスクを表示または編集するには[表示]をクリックします。
    [マイジョブ]ページから、ステータスが[デプロイ済み]のジョブを実行できます。