データベース取り込みとレプリケーション > データベース取り込みとレプリケーションタスクの設定 > タスクの詳細: ターゲットにデータをレプリケートする方法の設定
  

タスクの詳細: ターゲットにデータをレプリケートする方法の設定

タスクの詳細の手順2でデータターゲットを設定します。
    bullet[ターゲットプロパティ]で、必須の基本ターゲットプロパティを設定します。次に、ページ上部の[詳細オプションを表示]をオンにして、必要に応じてオプションの詳細ターゲットプロパティを設定します。次のようなターゲットタイプのプロパティの説明を参照してください。

Amazon Redshiftターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のAmazon Redshiftターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
    注:
    [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
バケット
Amazon Redshiftにロードするデータオブジェクトへのアクセスを保存、整理、および制御するAmazon S3のバケットコンテナの名前。
データディレクトリまたはタスクターゲットディレクトリ
データベース取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Amazon S3ターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のAmazon S3ターゲットプロパティを定義します。
プロパティ
説明
オープンテーブルフォーマット
Amazon S3ストレージにデータをレプリケートするためにオープンテーブル形式を使用するかどうかを制御します。
次のいずれかのオプションを選択します。
  • - Apache Iceberg。データをApache IcebergテーブルとしてAmazon S3クラウドストレージにレプリケートします。これらのテーブルには、AWS Glue Catalogを使用してAmazon S3から直接アクセスできます。
  • - なし。オープンテーブル形式を使用しません。
デフォルト値は[なし]です。
名前空間
Apache Icebergオープンテーブル形式を使用する場合は、Apache Icebergテーブルを保存および管理するデータベースの名前をAWS Glueカタログに入力してください。
出力形式
出力ファイルの形式を選択します。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
オープンテーブル形式を使用しない場合、デフォルト値は[CSV]です。オープンテーブル形式を選択すると、Apache Icebergでは[Parquet]がデフォルトで選択されます。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
ウェアハウスベースディレクトリ
Apache Icebergオープンテーブル形式を使用する場合は、ターゲットファイルとターゲットテーブルを保存するAmazon S3のルートディレクトリを入力してください。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
暗号化タイプ
Amazon S3ターゲットに書き込まれる出力ファイルの暗号化タイプを選択します。次のオプションがあります。
  • - なし
  • - クライアントサイドの暗号化
  • - KMSを使用したクライアントサイドの暗号化
  • - サーバーサイドの暗号化
  • - KMSを使用したサーバーサイドの暗号化
注:
[クライアントサイドの暗号化]または[KMSを使用したクライアントサイドの暗号化]を使用する場合、暗号化および復号されたファイルの最大サイズは64GBです。
デフォルト値は[なし]で、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
親としての接続ディレクトリ
ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスをオンにします。
初期ロードタスクの場合、親ディレクトリは、データディレクトリスキーマディレクトリで使用されます。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリスキーマディレクトリサイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。
このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。
データディレクトリ
初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
例:
myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Databricksターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のDatabricksターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
    注:
    [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
データディレクトリまたはタスクターゲットディレクトリ
データベース取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

フラットファイルターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のフラットファイルターゲットプロパティを定義します。
注:
フラットファイルターゲットの場合、これらのプロパティは初期ロードジョブにのみ適用されます。
プロパティ
説明
出力形式
出力ファイルの形式を選択します。次のオプションがあります。
  • - CSV
  • - AVRO
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
データディレクトリ
初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。ディレクトリパターンを定義するには、次のタイプのエントリを使用できます。
  • - プレースホルダ{SchemaName}、{TableName)、{Timestamp}、{YY}、{YYYY}、{MM}、および{DD}({YY}、{YYYY}、{MM}、および{DD}は日付要素です)。{Timestamp}値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - 特定のディレクトリ名。
  • - toUpper()およびtoLower()関数。これは、関連付けられた(placeholder)の値を強制的に大文字または小文字に変換します。
注:
プレースホルダの値の大文字と小文字は区別されません。
例:
myDir1/{SchemaName}/{TableName}
myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp}
myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
デフォルトのディレクトリパターンは{TableName)_{Timestamp}です。
注:
フラットファイルターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みおよびレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
親としての接続ディレクトリ
初期ロードタスクの場合、ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスを選択します。親ディレクトリは、データディレクトリスキーマディレクトリで使用されます。
スキーマディレクトリ
初期ロードタスクの場合、デフォルトディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定できます。このフィールドはオプションです。
デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロードの場合、スキーマファイルのデフォルトディレクトリは、{TaskTargetDirectory}/data/{TableName}/schemaです。
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダが中括弧{}で囲まれていることを確認します。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Google BigQueryターゲットの設定

Google BigQueryターゲットのあるデータベース取り込みとレプリケーションタスクを定義する場合、タスクウィザードの[ターゲット]タブでターゲットのいくつかのプロパティを入力する必要があります。

ターゲットプロパティ

次の必須のGoogle BigQueryターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
    注:
    [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
バケット
Google Cloud Storageにロードするデータオブジェクトへのアクセスを保存、整理、および制御する既存のバケットコンテナの名前。
データディレクトリまたはタスクターゲットディレクトリ
データベース取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Google Cloud Storageターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のGoogle Cloud Storageターゲットプロパティを定義します。
プロパティ
説明
出力形式
出力ファイルの形式。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
バケット
Google Cloud Storageにロードするデータオブジェクトへのアクセスを保存、整理、および制御する既存のバケットコンテナの名前。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
データディレクトリ
初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
例:
myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Kafkaターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のKafkaターゲットプロパティを定義します。
注:
これらのプロパティは、増分ロード操作にのみ適用されます。
プロパティ
説明
テーブル名をトピック名として使用
データベース取り込みとレプリケーションが、ソースデータを含むメッセージをソーステーブルごとに1つずつ個別のトピックに書き込むか、すべてのメッセージを1つのトピックに書き込むかを制御します。
テーブル固有のトピックを区切るメッセージを書き込むには、このチェックボックスを選択します。トピック名は、[スキーマ名を含める][テーブルプレフィックス]、または[テーブルサフィックス]プロパティに追加しない限り、トピック名はソーステーブル名に一致します。
デフォルトでは、このチェックボックスはオフです。デフォルト設定では、[トピック名]プロパティにすべてのメッセージが書き込まれる単一のトピックの名前を指定する必要があります。
スキーマ名を含める
[テーブル名をトピック名として使用]が選択されている場合、このチェックボックスが表示され、デフォルトで選択されています。この設定により、テーブル固有のトピック名にソーススキーマ名が追加されます。トピック名の形式は次のとおりです。スキーマ名_テーブル名
スキーマ名を含めない場合は、このチェックボックスをオフにします。
テーブルプレフィックス
テーブル名をトピック名として使用を選択すると、このプロパティが表示され、オプションでプレフィックスを入力してテーブル固有のトピック名に追加できます。例えば、myprefix_を指定すると、トピック名の形式は「myprefix_テーブル名」になります。プレフィックスの後のアンダースコア(_)を省略すると、プレフィックスがテーブル名の前に追加されます。
テーブルサフィックス
テーブル名をトピック名として使用を選択すると、このプロパティが表示され、オプションでサフィックスを入力してテーブル固有のトピック名に追加できます。例えば、_mysuffixを指定すると、トピック名の形式は「テーブル名_mysuffix」になります。サフィックスの前のアンダースコア(_)を省略すると、サフィックスがテーブル名に追加されます。
トピック名
[テーブル名をトピック名として使用]が選択されていない場合は、ソースデータを含むすべてのメッセージが書き込まれる単一のKafkaトピックの名前を入力する必要があります。
出力形式
出力ファイルの形式を選択します。次のオプションがあります。
  • - CSV
  • - AVRO
  • - JSON
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
KafkaターゲットがConfluent Schema Registryを使用して増分ロードジョブのスキーマを格納する場合は、形式として[AVRO]を選択する必要があります。
JSON形式
出力形式として[JSON]が選択されている場合は、出力の詳細レベルを選択します。次のオプションがあります。
  • - 簡潔。この形式では、操作タイプやカラムの名前と値など、最も関連性の高いデータのみが出力に記録されます。
  • - 詳細。この形式では、テーブル名やカラムタイプなどの詳細情報が記録されます。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式としてAVROが選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - Binary
  • - JSON
  • - なし
デフォルト値は[Binary]です。
Confluent Schema Registryを使用してスキーマを格納するConfluent Kafkaターゲットがある場合は、[なし]を選択します。それ以外の場合、Confluent Schema Registryはスキーマを登録しません。Confluent Scheme Registryを使用していない場合、[なし]は選択しないでください。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ソーススキーマの変更によってターゲットが変更されることが予想される場合、Avroスキーマ定義ファイルは、タイムスタンプを含む一意の名前で次の形式で再生成されます。
schemaname_tablename_YYYYMMDDhhmmss.txt
この一意の命名パターンにより、古いスキーマ定義ファイルが監査目的で保持されます。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft Azure Data Lake Storageターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のMicrosoft Azure Data Lake Storageターゲットプロパティを定義します。
プロパティ
説明
出力形式
出力ファイルの形式。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
親としての接続ディレクトリ
ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスをオンにします。
初期ロードタスクの場合、親ディレクトリは、データディレクトリスキーマディレクトリで使用されます。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリスキーマディレクトリサイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。
このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。
データディレクトリ
初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
例:
myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft Azure Synapse Analyticsターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のMicrosoft Azure Synapse Analyticsターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。接続プロパティで指定されたスキーマ名がデフォルトで表示されます。このフィールドでは大文字と小文字が区別されるため、接続プロパティのスキーマ名が適切な大文字小文字表記で入力されていることを確認してください。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft Fabric Data Warehouseターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のMicrosoft Fabric Data Warehouseターゲットプロパティを定義します。
プロパティ
説明
スキーマパス
データベース取り込みとレプリケーションがターゲットテーブルを作成するスキーマパスを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
ステージングレイクハウス名
Microsoft Fabric Data Warehouseに読み込む前にデータを一時的に保存するデータレイク内の中間ストレージの場所の名前。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft Fabric OneLakeターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のMicrosoft Fabric OneLakeターゲットプロパティを定義します。
プロパティ
説明
オープンミラーリング
Microsoft Fabricオープンミラーリングを使用するには、このチェックボックスを選択します。オープンミラーリングにより、ソースデータの同期されたほぼリアルタイムのコピーを、Parquet形式でMicrosoft Fabric OneLakeに作成します。詳細については、Microsoft Fabric OneLakeにデータをレプリケートするためのオープンミラーリングの使用を参照してください。
注:
オープンミラーリングを有効にする前に、出力形式として[Parquet]を選択してから、オープンミラーリングの設定を続行するようにしてください。
ランディングゾーンのURL。
[オープンミラーリング]を選択した場合は、ミラーリングされたデータファイルがMicrosoft Fabricで処理される前にParquet形式で保存される、固有のMicrosoft Fabric OneLakeパスを入力します。
注:
オープンミラーリングを有効にすると、このテーブルのその他の項目は適用されなくなります。
出力形式
出力ファイルの形式を選択します。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
注:
オープンミラーリングはParquet出力形式を使用します。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
データディレクトリ
初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
例:
myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Microsoft SQL Serverターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のMicrosoft SQL Serverターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
    注:
    [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
[次へ]をクリックして次に進むか、[保存]をクリックします。

オープンテーブルターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のオープンテーブルターゲットプロパティを定義します。
プロパティ
説明
スキーマパス
データベース取り込みとレプリケーションがターゲットテーブルを作成する、オープンテーブルのスキーマパス。
データベース名付きのカタログ名
タスクが、ターゲットテーブルのメタデータを整理および保存するためのカタログ名およびデータベース名。
次の形式で値を入力してください: <catalogname>/<databasename>
テーブルの場所
タスクがオープンテーブルのデータファイルを作成する場所となるAmazon S3のストレージパス。
例: s3://s3format/cdc
テーブルプロパティ
オープンテーブルターゲットに対して定義可能な構成設定。
値を、カンマ区切りのキーと値のペアとして次の形式で入力してください: '<parameter name>=<parameter value>'='<parameter value>','<parameter name>=<parameter value>'='<parameter value>'
オープンテーブルターゲットの場合、タスクはデータをParquet形式でロードします。そのため、次のプロパティを含める必要があります: 'format'='parquet'
テーブルタイプ
オープンテーブルフォーマットの保存および管理方法を定義するテーブルタイプ
値をicebergに設定する必要があります。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
大文字と小文字の変換を有効にする
デフォルトでは、ターゲットテーブル名およびカラム名は、対応するソース名と同じ大文字と小文字で生成されます。ただし、ターゲットのクラスタレベルまたはセッションレベルのプロパティがこの大文字と小文字を区別する動作をオーバーライドしている場合を除きます。ターゲット名の大文字と小文字を制御する場合は、このチェックボックスを選択します。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Oracleターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のOracleターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで行われたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号などの変更に関するメタデータが含まれています。監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Oracle Cloud Object Storageターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のOracle Cloud Object Storageターゲットプロパティを定義します。
プロパティ
説明
出力形式
出力ファイルの形式。次のオプションがあります。
  • - CSV
  • - AVRO
  • - PARQUET
デフォルトの値は[CSV]です。
注:
CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。
CSVファイルへのヘッダーの追加
[CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。
Avro形式
出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
  • - Avro-Flat。すべてのAvroフィールドを1つのレコードに一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Generic。ソーステーブルのすべてのカラムをAvroフィールドの単一の配列に一覧表示する場合に、このAvroスキーマ形式を使用します。
  • - Avro-Nested。各タイプの情報を個別のレコードに編成する場合に、このAvroスキーマ形式を使用します。
デフォルト値は[Avro-Flat]です。
Avroシリアル化形式
出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
  • - なし
  • - Binary
  • - JSON
デフォルト値は[Binary]です。
Avroスキーマディレクトリ
出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。
schemaname_tablename.txt
注:
このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。
ファイル圧縮タイプ
CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
  • - なし
  • - Deflate
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Avro圧縮タイプ
[AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Bzip2
  • - Deflate
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Parquet圧縮タイプ
[PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
  • - なし
  • - Gzip
  • - Snappy
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。
Deflate圧縮レベル
[Deflate][Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。
ディレクトリタグの追加
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。
タスクターゲットディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。
このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。
親としての接続ディレクトリ
ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスをオンにします。
初期ロードタスクの場合、親ディレクトリは、データディレクトリスキーマディレクトリで使用されます。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリスキーマディレクトリサイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。
このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。
データディレクトリ
初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。フォルダ名を入力するか、変数を使用してフォルダ名を作成します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、初期ロードジョブがターゲットへのデータの転送を開始した日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
例:
myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp}
注:
ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。
デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。
ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
  • - フォルダパス。接続プロパティで指定したS3フォルダパスの代わりに使用する、ターゲット上のタスク固有のベースディレクトリを表す{TaskTargetDirectory}を入力します。
  • - タイムスタンプ値。データ要素(Timestampyyyyyymm、またはdd)を選択します。Timestamp値の形式はyyyymmdd_hhmissmsです。ディレクトリパスに生成された日付と時刻は、CDCサイクルが開始された日付と時刻を表します。
  • - スキーマ名SchemaNametoUpper(SchemaName)、またはtoLower(SchemaName)を選択します。
  • - [テーブル名]TableNametoUpper(TableName)、およびtoLower(TableName)を選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。
Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。
Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。
オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。
スキーマディレクトリ
デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。
初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema
[データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。
注:
スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。
サイクル完了ディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/completedです。
サイクルコンテンツディレクトリ
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。
デフォルトは{TaskTargetDirectory}/cycle/contentsです。
データディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。
このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。
サマリディレクトリにサイクルのパーティション化を使用する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。
コンテンツ内の個々のファイルを一覧表示する
増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。
[サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。
[データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。
[次へ]をクリックして次に進むか、[保存]をクリックします。

PostgreSQLターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のPostgreSQLターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
    注:
    [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Salesforce Data 360のターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のSalesforce Data 360ターゲットプロパティを定義します。
プロパティ
説明
スキーマパス
データベース取り込みとレプリケーションがターゲットテーブルを作成するスキーマパス。
データスペース
データをロードするSalesforce Data 360のデータスペースの名前。
データスペースを入力しない場合は、デフォルトのデータスペースが使用されます。
カテゴリ
Salesforce Data 360にデータをロードする際にソースストリームからのデータに割り当てられるデータカテゴリ。
次のオプションがあります。
  • - プロファイル。名前、電子メールアドレス、住所などの顧客属性に適用されます。
  • - エンゲージメント。ウェブサイト訪問、メール開封、クリック、その他のアクティビティログなどの行動データやインタラクションデータに適用されます。
  • - その他。プロファイルやエンゲージメントに当てはまらないデータ、例えばトランザクションレコード、注文履歴、CRMシステムログ、その他のシステムデータやコンテキストデータなどに適用されます。
イベント時刻フィールド
[エンゲージメント]カテゴリを選択した場合における、エンゲージメントレコードのイベント日時フィールドの名前。購入、クリック、ログインなどのインタラクションがいつ行われたのかを正確に定義し、最近のイベントや関連するイベントを特定するのに役立ちます。
レコード変更済みフィールド
[プロファイル]または[その他]カテゴリを選択した場合、レコードが最後に更新された日時をキャプチャするレコード変更済みフィールドの名前です。
適用モード
このプロパティは、増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合に、挿入、更新、削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。
[標準]適用モードのみ使用できます。このモードは、1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
[次へ]をクリックして次に進むか、[保存]をクリックします。

Snowflake Data Cloudターゲットの設定

[接続先]ページで選択した接続先のターゲットプロパティを定義します。

ターゲットプロパティ

次の必須のSnowflakeターゲットプロパティを定義します。
プロパティ
説明
ターゲット作成
利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。
注:
ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。
スキーマ
データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。
ステージ
データがターゲットテーブルに書き込まれる前にソースから読み取られたデータを保持する内部ステージング領域の名前。この名前にスペースを含めることはできません。指定されたステージング領域が存在しない場合、自動的に作成されます。
注:
[詳細ターゲットプロパティ]で[Superpipe]オプションを選択した場合、このフィールドは使用できません。
適用モード
増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
  • - 標準。1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。
  • - 論理削除。ソース削除操作を論理削除としてターゲットに適用します。論理削除では、削除された行をデータベースから実際には削除せずに、削除済みとしてマークします。例えば、ソースで削除を行うと、ターゲットの変更レコードのINFA_OPERATION_TYPEカラムに「D」が表示されます。
  • 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。
    注:
    [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。
  • - 監査。ソーステーブルで実行されたすべてのDML操作の監査証跡をターゲットに適用します。ソーステーブルの各DML変更の行が、[詳細]セクションで選択した監査カラムとともに、生成されたターゲットテーブルに書き込まれます。監査カラムには、DML操作タイプ、時刻、所有者、トランザクションID、生成された昇順シーケンス番号、および前のイメージなどの変更に関するメタデータが含まれています。
  • 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。
デフォルト値は[標準]です。
注:
タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。
[次へ]をクリックして次に進むか、[保存]をクリックします。