プロパティ | 説明 |
|---|---|
ターゲット作成 | 利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。 注: ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。 |
スキーマ | データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。 注: [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。 デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
バケット | Amazon Redshiftにロードするデータオブジェクトへのアクセスを保存、整理、および制御するAmazon S3のバケットコンテナの名前。 |
データディレクトリまたはタスクターゲットディレクトリ | データベース取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。 |
プロパティ | 説明 |
|---|---|
最終レプリケート時刻を追加 | ターゲットテーブルでレコードが挿入または最後に更新された時点のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。初期ロードでは、ロードされたすべてのレコードのタイムスタンプが同じになります。増分ロード、および初期ロードと増分ロードの組み合わせの場合、このカラムには、ターゲットに適用された最後のDML操作のタイムスタンプが記録されます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作タイプの追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]オプションが[監査]または[論理削除]に設定されている場合にのみ使用できます。 監査モードでは、ジョブはこのメタデータカラムに、挿入の場合は「I」、更新の場合は「U」、更新/挿入の場合は「E」、削除の場合は「D」を書き込みます。 論理削除モードでは、ジョブは削除の場合は「D」を書き込み、挿入、更新、および更新/挿入の場合はNULLを書き込みます。操作タイプがNULLの場合、他の[操作の追加...]メタデータカラムもNULLです。操作タイプが「D」の場合にのみ、他のメタデータカラムにNULL以外の値が含まれます。 デフォルトでは、このチェックボックスは選択されています。論理削除を使用している場合は、選択を解除できません。 |
操作時間の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットシステムの監査テーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットテーブルに挿入する出力にUNDOの「操作前のイメージ」データを含む_OLDカラムを追加するには、このチェックボックスを選択します。これにより、各データカラムの以前の値と現在の値を比較できるようになります。削除操作の場合、現在の値はNULLになります。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
サイクルIDの追加 | 各ターゲットテーブルの各CDCサイクルのサイクルIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。サイクルIDは、CDCサイクルが成功するたびにCDCエンジンによって生成される番号です。ジョブをデータ統合タスクフローと統合すると、ジョブは出力フィールドで最小サイクルIDと最大サイクルIDをタスクフローに渡して、タスクフローが新しいCDCデータを含むサイクルの範囲を判断できるようにします。この機能は、前のタスクフロー実行が完了する前に複数のサイクルのデータが蓄積される場合に便利です。デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 デフォルト値はINFA_です。 |
大文字と小文字の変換を有効にする | デフォルトでは、ターゲットテーブル名およびカラム名は、対応するソース名と同じ大文字と小文字で生成されます。ただし、ターゲットのクラスタレベルまたはセッションレベルのプロパティがこの大文字と小文字を区別する動作をオーバーライドしている場合を除きます。ターゲット名の大文字と小文字を制御する場合は、このチェックボックスを選択します。次に、[大文字と小文字の変換ストラテジ]オプションを選択します。 |
大文字と小文字の変換ストラテジ | [大文字と小文字の変換を有効にする]を選択した場合は、以下のいずれかのオプションを選択して、生成されたターゲットテーブル(またはオブジェクト)名およびカラム(またはフィールド)名の大文字と小文字の処理方法を指定します。
デフォルト値は、[ソースと同じ]です。 注: 選択したストラテジは、大文字と小文字の制御に関するターゲットのクラスタレベルまたはセッションレベルのプロパティをオーバーライドします。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
オープンテーブルフォーマット | Amazon S3ストレージにデータをレプリケートするためにオープンテーブル形式を使用するかどうかを制御します。 次のいずれかのオプションを選択します。
デフォルト値は[なし]です。 |
名前空間 | Apache Icebergオープンテーブル形式を使用する場合は、Apache Icebergテーブルを保存および管理するデータベースの名前をAWS Glueカタログに入力してください。 |
出力形式 | 出力ファイルの形式を選択します。次のオプションがあります。
オープンテーブル形式を使用しない場合、デフォルト値は[CSV]です。オープンテーブル形式を選択すると、Apache Icebergでは[Parquet]がデフォルトで選択されます。 注: CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。 |
ウェアハウスベースディレクトリ | Apache Icebergオープンテーブル形式を使用する場合は、ターゲットファイルとターゲットテーブルを保存するAmazon S3のルートディレクトリを入力してください。 |
CSVファイルへのヘッダーの追加 | [CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。 |
Avro形式 | 出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
デフォルト値は[Avro-Flat]です。 |
Avroシリアル化形式 | 出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
デフォルト値は[Binary]です。 |
Avroスキーマディレクトリ | 出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。 schemaname_tablename.txt 注: このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。 |
ファイル圧縮タイプ | CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
暗号化タイプ | Amazon S3ターゲットに書き込まれる出力ファイルの暗号化タイプを選択します。次のオプションがあります。
注: [クライアントサイドの暗号化]または[KMSを使用したクライアントサイドの暗号化]を使用する場合、暗号化および復号されたファイルの最大サイズは64GBです。 デフォルト値は[なし]で、これは圧縮が使用されないことを意味します。 |
Avro圧縮タイプ | [AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Parquet圧縮タイプ | [PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Deflate圧縮レベル | [Deflate]が[Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。 |
ディレクトリタグの追加 | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。 |
タスクターゲットディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。 このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。 |
親としての接続ディレクトリ | ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスをオンにします。 初期ロードタスクの場合、親ディレクトリは、データディレクトリとスキーマディレクトリで使用されます。 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリ、スキーマディレクトリ、サイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。 このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。 |
データディレクトリ | 初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
例: myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp} 注: ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。 デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。 Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。 Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。 オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 |
スキーマディレクトリ | デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。 初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema。 [データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。 注: スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。 |
サイクル完了ディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/completedです。 |
サイクルコンテンツディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/contentsです。 |
データディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。 このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。 |
サマリディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。 |
コンテンツ内の個々のファイルを一覧表示する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。 [サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。 [データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。 |
プロパティ | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 増分ロードの場合、ジョブは、挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。初期ロードの場合、ジョブは常に、挿入を表す「I」を書き込みます。 デフォルトでは、このチェック ボックスは、増分ロードジョブ、初期および増分ロードジョブの場合はオンになっており、初期ロードジョブの場合はオフになっています。 |
操作時間の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 初期ロードの場合、ジョブは常に現在の日付と時刻を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常に所有者として「INFA」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常にIDとして「1」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
ソート可能シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、エポック値と増分値の組み合わせを記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス値は常に昇順ですが、シーケンシャルであることは保証されず、ギャップが存在する可能性があります。シーケンス値を使用して、ターゲットレコード内のアクティビティの順序を特定できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットに書き込む出力にUNDOデータを含めるには、このチェックボックスを選択します。 初期ロードの場合、ジョブはnullを書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ターゲット作成 | 利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。 注: ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。 |
スキーマ | データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。 注: [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。 デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
データディレクトリまたはタスクターゲットディレクトリ | データベース取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。 |
プロパティ | 説明 |
|---|---|
最終レプリケート時刻を追加 | ターゲットでレコードが挿入された時点または最後に更新された時点のタイムスタンプをUTCで記録するメタデータカラムを追加するには、このチェックボックスを選択します。このカラムは、各ターゲットテーブルでINFA_LAST_REPLICATEDというカラム名とTIMESTAMP_NTZデータ型を使用して生成されます。 初期ロードでは、すべての挿入レコードのタイムスタンプが同じになります。増分ロード、および初期ロードと増分ロードの組み合わせの場合、このカラムには、最後の更新が適用された時点のタイムスタンプが記録されます。 UTC以外のタイムゾーンを使用する必要がある場合は、overrideTimezoneForLastReplicatedターゲットカスタムプロパティで指定できます。詳細については、Informaticaグローバルカスタマサポートにお問い合わせください。 注: Databricksクラスタを使用する場合、クラスタのバージョンが13.3以降であることを確認してください。 デフォルトでは、このチェックボックスは選択されていません。 |
操作タイプの追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットテーブルに挿入する出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]オプションが[監査]または[論理削除]に設定されている場合にのみ使用できます。 [監査]モードでは、ジョブは挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。 論理削除モードでは、ジョブは削除の場合は「D」を書き込み、挿入と更新の場合はNULLを書き込みます。操作タイプがNULLの場合、他の[操作の追加...]メタデータカラムもNULLです。操作タイプが「D」の場合にのみ、他のメタデータカラムにNULL以外の値が含まれます。 デフォルトでは、このチェックボックスは選択されています。論理削除を使用している場合は、選択を解除できません。 |
操作時間の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットシステムの監査テーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットテーブルに挿入する出力にUNDOの「操作前のイメージ」データを含む_OLDカラムを追加するには、このチェックボックスを選択します。これにより、各データカラムの以前の値と現在の値を比較できるようになります。削除操作の場合、現在の値はNULLになります。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 デフォルト値はINFA_です。 |
アンマネージドテーブルの作成 | タスクでDatabricksターゲットテーブルをアンマネージドテーブルとして作成する場合は、このチェックボックスを選択します。タスクをデプロイした後は、このフィールドを編集してマネージドテーブルに切り替えることはできません。 デフォルトでは、このオプションはオフになっており、マネージドテーブルが作成されます。 選択したDatabricksターゲット接続の[ステージング環境]フィールドで[個人のステージング場所]を選択した場合、このチェックボックスは無効になります。この状況では、アンマネージドテーブルは使用できません。 Databricksのマネージドテーブルとアンマネージドテーブルの詳細については、Databricksのドキュメントを参照してください。 |
非管理対象テーブルの親ディレクトリ | Databricksアンマネージドテーブルを作成する場合は、キャプチャされたDMLレコードの処理時にターゲットテーブルごとに生成されるParquetファイルを保持するために、Amazon S3またはMicrosoft Azure Data Lake Storageに存在する親ディレクトリを指定する必要があります。 注: Unity Catalogを使用するには、既存の外部ディレクトリを指定する必要があります。 注: ボリュームのステージング用に、親ディレクトリの完全なパスを指定してください。 |
ステージングファイル形式 | Databricks接続で指定されたステージング環境でのステージングファイルの形式を選択します。これらのファイルは、Databricksテーブルに読み込まれる前のデータを保持します。 形式オプションは次のとおりです。
デフォルトはCSVです。 |
プロパティ | 説明 |
|---|---|
ライタディストリビュータ数 | [ライタアンロード複数ディストリビュータ]カスタムプロパティがtrueに設定されている場合、初期ロードジョブ中または組み合わせロードジョブのアンロードフェーズ中に、データを処理するために個別のスレッドで並列して実行できるディストリビュータの数。並列ディストリビュータスレッドを使用すると、特に大量のデータ転送で、ジョブのパフォーマンスが向上します。 デフォルト値は3です。システムに十分なリソースがある場合は、このパラメータを8に設定することをお勧めします。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なディストリビュータ数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタアンロード複数ディストリビュータ | 初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でデータを処理するために複数のディストリビュータスレッドを使用できるかどうかを示します。ディストリビュータは、ステージング領域へのデータファイルのアップロードやターゲットへのデータのフラッシュなどの作業を行います。このプロパティをtrueに設定すると、複数のディストリビュータスレッドが使用されます。 デフォルト値はfalseです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって複数のディストリビュータを使用するかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
出力形式 | 出力ファイルの形式を選択します。次のオプションがあります。
デフォルトの値は[CSV]です。 注: CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。 |
CSVファイルへのヘッダーの追加 | [CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。 |
Avro形式 | 出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
デフォルト値は[Avro-Flat]です。 |
Avroシリアル化形式 | 出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
デフォルト値は[Binary]です。 |
Avroスキーマディレクトリ | 出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。 schemaname_tablename.txt 注: このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。 |
ファイル圧縮タイプ | CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Avro圧縮タイプ | [AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Deflate圧縮レベル | [Deflate]が[Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。 |
データディレクトリ | 初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。ディレクトリパターンを定義するには、次のタイプのエントリを使用できます。
注: プレースホルダの値の大文字と小文字は区別されません。 例: myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp} デフォルトのディレクトリパターンは{TableName)_{Timestamp}です。 注: フラットファイルターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みおよびレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。 |
親としての接続ディレクトリ | 初期ロードタスクの場合、ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスを選択します。親ディレクトリは、データディレクトリとスキーマディレクトリで使用されます。 |
スキーマディレクトリ | 初期ロードタスクの場合、デフォルトディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定できます。このフィールドはオプションです。 デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロードの場合、スキーマファイルのデフォルトディレクトリは、{TaskTargetDirectory}/data/{TableName}/schemaです。 [データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダが中括弧{}で囲まれていることを確認します。 |
プロパティ | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットに伝播する出力にソースSQL操作タイプを含むメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常に挿入を表す「I」を書き込みます。 デフォルトでは、このチェックボックスはオフです。 |
操作時間の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 初期ロードの場合、ジョブは常に現在の日付と時刻を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常に所有者として「INFA」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常にIDとして「1」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
ソート可能シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、エポック値と増分値の組み合わせを記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス値は常に昇順ですが、シーケンシャルであることは保証されず、ギャップが存在する可能性があります。シーケンス値を使用して、ターゲットレコード内のアクティビティの順序を特定できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットに書き込む出力にUNDOデータを含めるには、このチェックボックスを選択します。 初期ロードの場合、ジョブはnullを書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ターゲット作成 | 利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。 注: ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。 |
スキーマ | データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。 注: [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。 デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
バケット | Google Cloud Storageにロードするデータオブジェクトへのアクセスを保存、整理、および制御する既存のバケットコンテナの名前。 |
データディレクトリまたはタスクターゲットディレクトリ | データベース取り込みとレプリケーションが、タスクに関連付けられたジョブの出力ファイルを格納するサブディレクトリ。このフィールドは、初期ロードジョブの場合は[データディレクトリ]、増分ロードジョブ、または初期ロードと増分ロードの組み合わせジョブの場合は[タスクターゲットディレクトリ]と呼ばれます。 |
プロパティ | 説明 |
|---|---|
最終レプリケート時刻を追加 | ターゲットテーブルでレコードが挿入または最後に更新された時点のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。初期ロードでは、ロードされたすべてのレコードのタイムスタンプが同じになります。増分ロード、および初期ロードと増分ロードの組み合わせの場合、このカラムには、ターゲットに適用された最後のDML操作のタイムスタンプが記録されます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作タイプの追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]オプションが[監査]または[論理削除]に設定されている場合にのみ使用できます。 監査モードでは、ジョブはこのメタデータカラムに、挿入の場合は「I」、更新の場合は「U」、更新/挿入の場合は「E」、削除の場合は「D」を書き込みます。 論理削除モードでは、ジョブは削除の場合は「D」を書き込み、挿入、更新、および更新/挿入の場合はNULLを書き込みます。操作タイプがNULLの場合、他の[操作の追加...]メタデータカラムもNULLです。操作タイプが「D」の場合にのみ、他のメタデータカラムにNULL以外の値が含まれます。 デフォルトでは、このチェックボックスは選択されています。論理削除を使用している場合は、選択を解除できません。 |
操作時間の追加 | ジョブがターゲットテーブルにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットテーブルにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットテーブルに挿入する出力にUNDOの「操作前のイメージ」データを含む_OLDカラムを追加するには、このチェックボックスを選択します。これにより、各データカラムの以前の値と現在の値を比較できるようになります。削除操作の場合、現在の値はNULLになります。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 プレフィックスには特殊文字を含めないようにしてください。特殊文字を含めた場合、タスクのデプロイメントが失敗します。 デフォルト値はINFA_です。 |
大文字と小文字の変換を有効にする | デフォルトでは、ターゲットテーブル名およびカラム名は、対応するソース名と同じ大文字と小文字で生成されます。ただし、ターゲットのクラスタレベルまたはセッションレベルのプロパティがこの大文字と小文字を区別する動作をオーバーライドしている場合を除きます。ターゲット名の大文字と小文字を制御する場合は、このチェックボックスを選択します。次に、[大文字と小文字の変換ストラテジ]オプションを選択します。 |
大文字と小文字の変換ストラテジ | [大文字と小文字の変換を有効にする]を選択した場合は、以下のいずれかのオプションを選択して、生成されたターゲットテーブル(またはオブジェクト)名およびカラム(またはフィールド)名の大文字と小文字の処理方法を指定します。
デフォルト値は、[ソースと同じ]です。 注: 選択したストラテジは、大文字と小文字の制御に関するターゲットのクラスタレベルまたはセッションレベルのプロパティをオーバーライドします。 |
プロパティ | 説明 |
|---|---|
ライタディストリビュータ数 | [ライタアンロード複数ディストリビュータ]カスタムプロパティがtrueに設定されている場合、初期ロードジョブ中または組み合わせロードジョブのアンロードフェーズ中に、データを処理するために個別のスレッドで並列して実行できるディストリビュータの数。並列ディストリビュータスレッドを使用すると、特に大量のデータ転送で、ジョブのパフォーマンスが向上します。 デフォルト値は3です。システムに十分なリソースがある場合は、このパラメータを8に設定することをお勧めします。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なディストリビュータ数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタアンロード複数ディストリビュータ | 初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でデータを処理するために複数のディストリビュータスレッドを使用できるかどうかを示します。ディストリビュータは、ステージング領域へのデータファイルのアップロードやターゲットへのデータのフラッシュなどの作業を行います。このプロパティをtrueに設定すると、複数のディストリビュータスレッドが使用されます。 デフォルト値はfalseです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって複数のディストリビュータを使用するかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
出力形式 | 出力ファイルの形式。次のオプションがあります。
デフォルトの値は[CSV]です。 注: CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。 |
CSVファイルへのヘッダーの追加 | [CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。 |
Avro形式 | 出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
デフォルト値は[Avro-Flat]です。 |
Avroシリアル化形式 | 出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
デフォルト値は[Binary]です。 |
Avroスキーマディレクトリ | 出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。 schemaname_tablename.txt 注: このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。 |
ファイル圧縮タイプ | CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Avro圧縮タイプ | [AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Parquet圧縮タイプ | [PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Deflate圧縮レベル | [Deflate]が[Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。 |
ディレクトリタグの追加 | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。 |
バケット | Google Cloud Storageにロードするデータオブジェクトへのアクセスを保存、整理、および制御する既存のバケットコンテナの名前。 |
タスクターゲットディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。 このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。 |
データディレクトリ | 初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
例: myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp} 注: ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。 デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。 Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。 Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。 オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 |
スキーマディレクトリ | デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。 初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema。 [データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。 注: スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。 |
サイクル完了ディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/completedです。 |
サイクルコンテンツディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/contentsです。 |
データディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。 このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。 |
サマリディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。 |
コンテンツ内の個々のファイルを一覧表示する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。 [サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。 [データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。 |
フィールド | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 増分ロードの場合、ジョブは、挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。初期ロードの場合、ジョブは常に、挿入を表す「I」を書き込みます。 デフォルトでは、このチェック ボックスは、増分ロードジョブ、初期および増分ロードジョブの場合はオンになっており、初期ロードジョブの場合はオフになっています。 |
操作時間の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 初期ロードの場合、ジョブは常に現在の日付と時刻を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常に所有者として「INFA」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常にIDとして「1」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
ソート可能シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、エポック値と増分値の組み合わせを記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス値は常に昇順ですが、シーケンシャルであることは保証されず、ギャップが存在する可能性があります。シーケンス値を使用して、ターゲットレコード内のアクティビティの順序を特定できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットに書き込む出力にUNDOデータを含めるには、このチェックボックスを選択します。 初期ロードの場合、ジョブはnullを書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
テーブル名をトピック名として使用 | データベース取り込みとレプリケーションが、ソースデータを含むメッセージをソーステーブルごとに1つずつ個別のトピックに書き込むか、すべてのメッセージを1つのトピックに書き込むかを制御します。 テーブル固有のトピックを区切るメッセージを書き込むには、このチェックボックスを選択します。トピック名は、[スキーマ名を含める]、[テーブルプレフィックス]、または[テーブルサフィックス]プロパティに追加しない限り、トピック名はソーステーブル名に一致します。 デフォルトでは、このチェックボックスはオフです。デフォルト設定では、[トピック名]プロパティにすべてのメッセージが書き込まれる単一のトピックの名前を指定する必要があります。 |
スキーマ名を含める | [テーブル名をトピック名として使用]が選択されている場合、このチェックボックスが表示され、デフォルトで選択されています。この設定により、テーブル固有のトピック名にソーススキーマ名が追加されます。トピック名の形式は次のとおりです。スキーマ名_テーブル名。 スキーマ名を含めない場合は、このチェックボックスをオフにします。 |
テーブルプレフィックス | テーブル名をトピック名として使用を選択すると、このプロパティが表示され、オプションでプレフィックスを入力してテーブル固有のトピック名に追加できます。例えば、myprefix_を指定すると、トピック名の形式は「myprefix_テーブル名」になります。プレフィックスの後のアンダースコア(_)を省略すると、プレフィックスがテーブル名の前に追加されます。 |
テーブルサフィックス | テーブル名をトピック名として使用を選択すると、このプロパティが表示され、オプションでサフィックスを入力してテーブル固有のトピック名に追加できます。例えば、_mysuffixを指定すると、トピック名の形式は「テーブル名_mysuffix」になります。サフィックスの前のアンダースコア(_)を省略すると、サフィックスがテーブル名に追加されます。 |
トピック名 | [テーブル名をトピック名として使用]が選択されていない場合は、ソースデータを含むすべてのメッセージが書き込まれる単一のKafkaトピックの名前を入力する必要があります。 |
出力形式 | 出力ファイルの形式を選択します。次のオプションがあります。
デフォルトの値は[CSV]です。 注: CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。 KafkaターゲットがConfluent Schema Registryを使用して増分ロードジョブのスキーマを格納する場合は、形式として[AVRO]を選択する必要があります。 |
JSON形式 | 出力形式として[JSON]が選択されている場合は、出力の詳細レベルを選択します。次のオプションがあります。
|
Avro形式 | 出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
デフォルト値は[Avro-Flat]です。 |
Avroシリアル化形式 | 出力形式としてAVROが選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
デフォルト値は[Binary]です。 Confluent Schema Registryを使用してスキーマを格納するConfluent Kafkaターゲットがある場合は、[なし]を選択します。それ以外の場合、Confluent Schema Registryはスキーマを登録しません。Confluent Scheme Registryを使用していない場合、[なし]は選択しないでください。 |
Avroスキーマディレクトリ | 出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。 schemaname_tablename.txt 注: このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。 ソーススキーマの変更によってターゲットが変更されることが予想される場合、Avroスキーマ定義ファイルは、タイムスタンプを含む一意の名前で次の形式で再生成されます。 schemaname_tablename_YYYYMMDDhhmmss.txt この一意の命名パターンにより、古いスキーマ定義ファイルが監査目的で保持されます。 |
Avro圧縮タイプ | [AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Deflate圧縮レベル | [Deflate]が[Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。 |
プロパティ | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイプを含むメタデータカラムを追加するには、このチェックボックスを選択します。 ジョブは、挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。 デフォルトでは、このチェックボックスは選択されています。 |
操作時間の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 デフォルトでは、このチェックボックスは選択されていません。 |
ソート可能シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、エポック値と増分値の組み合わせを記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス値は常に昇順ですが、シーケンシャルであることは保証されず、ギャップが存在する可能性があります。シーケンス値を使用して、ターゲットレコード内のアクティビティの順序を特定できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットに書き込む出力にUNDOデータを含めるには、このチェックボックスを選択します。 デフォルトでは、このチェックボックスは選択されていません。 |
非同期書き込み | Kafkaへのメッセージの同期配信を使用するかどうかを制御します。
デフォルトでは、このチェックボックスは選択されています。 |
プロデューサ設定プロパティ | key=valueペアをカンマで区切って指定して、Apache Kafka、Confluent Kafka、Amazon Managed Streaming for Apache Kafka(MSK)、またはKafka対応Azure Event HubsターゲットのKafkaプロデューサプロパティを入力します。 Confluent Schema Registryを使用してスキーマを格納するConfluentターゲットがある場合は、次のプロパティを指定する必要があります。 schema.registry.url=url, key.serializer=org.apache.kafka.common.serialization.StringSerializer, value.serializer=io.confluent.kafka.serializers.KafkaAvroSerializer Kafkaプロデューサーのプロパティは、このフィールドまたはKafka接続の追加の接続プロパティフィールドのいずれかに設定します。 このフィールドにプロデューサープロパティを入力すると、プロパティはこのタスクにのみ関連付けられたデータベース取り込みジョブに関係します。接続のプロデューサプロパティを入力する場合、[プロデューサ設定プロパティ]フィールドのプロパティを指定して特定のタスクの接続レベルのプロパティをオーバーライドしない限り、プロパティは接続定義を使用するすべてのタスクのジョブに関係します。 Kafkaプロデューサプロパティの詳細については、Apache Kafka、Confluent Kafka、Amazon MSK、またはAzure Event Hubs のドキュメントを参照してください。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
出力形式 | 出力ファイルの形式。次のオプションがあります。
デフォルトの値は[CSV]です。 注: CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。 |
CSVファイルへのヘッダーの追加 | [CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。 |
Avro形式 | 出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
デフォルト値は[Avro-Flat]です。 |
Avroシリアル化形式 | 出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
デフォルト値は[Binary]です。 |
Avroスキーマディレクトリ | 出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。 schemaname_tablename.txt 注: このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。 |
ファイル圧縮タイプ | CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Avro圧縮タイプ | [AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Parquet圧縮タイプ | [PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Deflate圧縮レベル | [Deflate]が[Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。 |
ディレクトリタグの追加 | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。 |
タスクターゲットディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。 このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。 |
親としての接続ディレクトリ | ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスをオンにします。 初期ロードタスクの場合、親ディレクトリは、データディレクトリとスキーマディレクトリで使用されます。 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリ、スキーマディレクトリ、サイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。 このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。 |
データディレクトリ | 初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
例: myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp} 注: ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。 デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。 Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。 Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。 オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 |
スキーマディレクトリ | デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。 初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema。 [データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。 注: スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。 |
サイクル完了ディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/completedです。 |
サイクルコンテンツディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/contentsです。 |
データディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。 このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。 |
サマリディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。 |
コンテンツ内の個々のファイルを一覧表示する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。 [サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。 [データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。 |
フィールド | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 増分ロードの場合、ジョブは、挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。初期ロードの場合、ジョブは常に、挿入を表す「I」を書き込みます。 デフォルトでは、このチェック ボックスは、増分ロードジョブ、初期および増分ロードジョブの場合はオンになっており、初期ロードジョブの場合はオフになっています。 |
操作時間の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 初期ロードの場合、ジョブは常に現在の日付と時刻を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常に所有者として「INFA」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常にIDとして「1」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
ソート可能シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、エポック値と増分値の組み合わせを記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス値は常に昇順ですが、シーケンシャルであることは保証されず、ギャップが存在する可能性があります。シーケンス値を使用して、ターゲットレコード内のアクティビティの順序を特定できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットに書き込む出力にUNDOデータを含めるには、このチェックボックスを選択します。 初期ロードの場合、ジョブはnullを書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ターゲット作成 | 利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。 注: ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。 |
スキーマ | データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。接続プロパティで指定されたスキーマ名がデフォルトで表示されます。このフィールドでは大文字と小文字が区別されるため、接続プロパティのスキーマ名が適切な大文字小文字表記で入力されていることを確認してください。 |
プロパティ | 説明 |
|---|---|
最終レプリケート時刻を追加 | ターゲットテーブルでレコードが挿入または最後に更新された時点のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。初期ロードでは、ロードされたすべてのレコードのタイムスタンプが同じになります。増分ロード、および初期ロードと増分ロードの組み合わせの場合、このカラムには、ターゲットに適用された最後のDML操作のタイムスタンプが記録されます。 デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 プレフィックスには特殊文字を含めないようにしてください。特殊文字を含めた場合、タスクのデプロイメントが失敗します。 デフォルト値はINFA_です。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
スキーマパス | データベース取り込みとレプリケーションがターゲットテーブルを作成するスキーマパスを選択します。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。 デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
ステージングレイクハウス名 | Microsoft Fabric Data Warehouseに読み込む前にデータを一時的に保存するデータレイク内の中間ストレージの場所の名前。 |
フィールド | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 増分ロードの場合、ジョブは、挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。初期ロードの場合、ジョブは常に、挿入を表す「I」を書き込みます。 デフォルトでは、このチェック ボックスは、増分ロードジョブ、初期および増分ロードジョブの場合はオンになっており、初期ロードジョブの場合はオフになっています。 |
操作時間の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 初期ロードの場合、ジョブは常に現在の日付と時刻を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常に所有者として「INFA」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常にIDとして「1」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットに書き込む出力にUNDOデータを含めるには、このチェックボックスを選択します。 初期ロードの場合、ジョブはnullを書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 デフォルト値はINFA_です。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
オープンミラーリング | Microsoft Fabricオープンミラーリングを使用するには、このチェックボックスを選択します。オープンミラーリングにより、ソースデータの同期されたほぼリアルタイムのコピーを、Parquet形式でMicrosoft Fabric OneLakeに作成します。詳細については、Microsoft Fabric OneLakeにデータをレプリケートするためのオープンミラーリングの使用を参照してください。 注: オープンミラーリングを有効にする前に、出力形式として[Parquet]を選択してから、オープンミラーリングの設定を続行するようにしてください。 |
ランディングゾーンのURL。 | [オープンミラーリング]を選択した場合は、ミラーリングされたデータファイルがMicrosoft Fabricで処理される前にParquet形式で保存される、固有のMicrosoft Fabric OneLakeパスを入力します。 注: オープンミラーリングを有効にすると、このテーブルのその他の項目は適用されなくなります。 |
出力形式 | 出力ファイルの形式を選択します。次のオプションがあります。
デフォルトの値は[CSV]です。CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。 注: オープンミラーリングはParquet出力形式を使用します。 |
CSVファイルへのヘッダーの追加 | [CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。 |
Avro形式 | 出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
デフォルト値は[Avro-Flat]です。 |
Avroシリアル化形式 | 出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
デフォルト値は[Binary]です。 |
Avroスキーマディレクトリ | 出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。 schemaname_tablename.txt 注: このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。 |
ファイル圧縮タイプ | CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Avro圧縮タイプ | [AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Parquet圧縮タイプ | [PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Deflate圧縮レベル | [Deflate]が[Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。 |
ディレクトリタグの追加 | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。 |
タスクターゲットディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。 このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。 |
データディレクトリ | 初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
例: myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp} 注: ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。 デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。 Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。 Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。 オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 |
スキーマディレクトリ | デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。 初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema。 [データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。 注: スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。 |
サイクル完了ディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/completedです。 |
サイクルコンテンツディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/contentsです。 |
データディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。 このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。 |
サマリディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。 |
コンテンツ内の個々のファイルを一覧表示する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。 [サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。 [データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ターゲット作成 | 利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。 注: ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。 |
スキーマ | データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。 注: [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。 デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
プロパティ | 説明 |
|---|---|
最終レプリケート時刻を追加 | ターゲットテーブルでレコードが挿入または最後に更新された時点のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。初期ロードでは、ロードされたすべてのレコードのタイムスタンプが同じになります。増分ロード、および初期ロードと増分ロードの組み合わせの場合、このカラムには、ターゲットに適用された最後のDML操作のタイムスタンプが記録されます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作タイプの追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]オプションが[監査]または[論理削除]に設定されている場合にのみ使用できます。 [監査]モードでは、ジョブは挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。 論理削除モードでは、ジョブは削除の場合は「D」を書き込み、挿入と更新の場合はNULLを書き込みます。操作タイプがNULLの場合、他の[操作の追加...]メタデータカラムもNULLです。操作タイプが「D」の場合にのみ、他のメタデータカラムにNULL以外の値が含まれます。 デフォルトでは、このチェックボックスは選択されています。論理削除を使用している場合は、選択を解除できません。 |
操作時間の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットシステムの監査テーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットテーブルに挿入する出力にUNDOの「操作前のイメージ」データを含む_OLDカラムを追加するには、このチェックボックスを選択します。これにより、各データカラムの以前の値と現在の値を比較できるようになります。削除操作の場合、現在の値はNULLになります。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
サイクルIDの追加 | 各ターゲットテーブルの各CDCサイクルのサイクルIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。サイクルIDは、CDCサイクルが成功するたびにCDCエンジンによって生成される番号です。ジョブをデータ統合タスクフローと統合すると、ジョブは出力フィールドで最小サイクルIDと最大サイクルIDをタスクフローに渡して、タスクフローが新しいCDCデータを含むサイクルの範囲を判断できるようにします。この機能は、前のタスクフロー実行が完了する前に複数のサイクルのデータが蓄積される場合に便利です。デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 プレフィックスには特殊文字を含めないようにしてください。特殊文字を含めた場合、タスクのデプロイメントが失敗します。 デフォルト値はINFA_です。 |
プロパティ | 説明 |
|---|---|
ライタディストリビュータ数 | [ライタアンロード複数ディストリビュータ]カスタムプロパティがtrueに設定されている場合、初期ロードジョブ中または組み合わせロードジョブのアンロードフェーズ中に、データを処理するために個別のスレッドで並列して実行できるディストリビュータの数。並列ディストリビュータスレッドを使用すると、特に大量のデータ転送で、ジョブのパフォーマンスが向上します。 デフォルト値は3です。システムに十分なリソースがある場合は、このパラメータを8に設定することをお勧めします。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なディストリビュータ数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタアンロード複数ディストリビュータ | 初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でデータを処理するために複数のディストリビュータスレッドを使用できるかどうかを示します。ディストリビュータは、ステージング領域へのデータファイルのアップロードやターゲットへのデータのフラッシュなどの作業を行います。このプロパティをtrueに設定すると、複数のディストリビュータスレッドが使用されます。 デフォルト値はfalseです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって複数のディストリビュータを使用するかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
スキーマパス | データベース取り込みとレプリケーションがターゲットテーブルを作成する、オープンテーブルのスキーマパス。 |
データベース名付きのカタログ名 | タスクが、ターゲットテーブルのメタデータを整理および保存するためのカタログ名およびデータベース名。 次の形式で値を入力してください: <catalogname>/<databasename> |
テーブルの場所 | タスクがオープンテーブルのデータファイルを作成する場所となるAmazon S3のストレージパス。 例: s3://s3format/cdc |
テーブルプロパティ | オープンテーブルターゲットに対して定義可能な構成設定。 値を、カンマ区切りのキーと値のペアとして次の形式で入力してください: '<parameter name>=<parameter value>'='<parameter value>','<parameter name>=<parameter value>'='<parameter value>' オープンテーブルターゲットの場合、タスクはデータをParquet形式でロードします。そのため、次のプロパティを含める必要があります: 'format'='parquet' |
テーブルタイプ | オープンテーブルフォーマットの保存および管理方法を定義するテーブルタイプ 値をicebergに設定する必要があります。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。 デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
大文字と小文字の変換を有効にする | デフォルトでは、ターゲットテーブル名およびカラム名は、対応するソース名と同じ大文字と小文字で生成されます。ただし、ターゲットのクラスタレベルまたはセッションレベルのプロパティがこの大文字と小文字を区別する動作をオーバーライドしている場合を除きます。ターゲット名の大文字と小文字を制御する場合は、このチェックボックスを選択します。 |
フィールド | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 増分ロードの場合、ジョブは、挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。初期ロードの場合、ジョブは常に、挿入を表す「I」を書き込みます。 デフォルトでは、このチェック ボックスは、増分ロードジョブ、初期および増分ロードジョブの場合はオンになっており、初期ロードジョブの場合はオフになっています。 |
操作時間の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 初期ロードの場合、ジョブは常に現在の日付と時刻を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常に所有者として「INFA」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常にIDとして「1」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットに書き込む出力にUNDOデータを含めるには、このチェックボックスを選択します。 初期ロードの場合、ジョブはnullを書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 デフォルト値はINFA_です。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ターゲット作成 | 利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。 注: ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。 |
スキーマ | データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
フィールド | 説明 |
|---|---|
最終レプリケート時刻を追加 | ターゲットテーブルでレコードが挿入または最後に更新された時点のタイムスタンプをUTC形式で記録するメタデータカラムを追加するには、このチェックボックスを選択します。初期ロードでは、ロードされたすべてのレコードのタイムスタンプが同じになります。増分ロード、および初期ロードと増分ロードの組み合わせの場合、このカラムには、ターゲットに適用された最後のDML操作のタイムスタンプが記録されます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作タイプの追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットテーブルに挿入する出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 ジョブは、挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。 デフォルトでは、このチェックボックスは選択されています。 |
操作時間の追加 | ジョブがターゲットテーブルにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットテーブルに挿入する出力にUNDOの「操作前のイメージ」データを含む_OLDカラムを追加するには、このチェックボックスを選択します。これにより、各データカラムの以前の値と現在の値を比較できるようになります。削除操作の場合、現在の値はNULLになります。 デフォルトでは、このチェックボックスは選択されていません。 |
サイクルIDの追加 | 各ターゲットテーブルの各CDCサイクルのサイクルIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。サイクルIDは、CDCサイクルが成功するたびにCDCエンジンによって生成される番号です。ジョブをデータ統合タスクフローと統合すると、ジョブは出力フィールドで最小サイクルIDと最大サイクルIDをタスクフローに渡して、タスクフローが新しいCDCデータを含むサイクルの範囲を判断できるようにします。この機能は、前のタスクフロー実行が完了する前に複数のサイクルのデータが蓄積される場合に便利です。デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 デフォルト値はINFA_です。 |
大文字と小文字の変換を有効にする | デフォルトでは、ターゲットテーブル名とカラム名は、対応するソース名と同じ大文字と小文字で生成されます。ターゲット名の大文字と小文字を制御する場合は、このチェックボックスを選択します。次に、[大文字と小文字の変換ストラテジ]オプションを選択します。 |
大文字と小文字の変換ストラテジ | [大文字と小文字の変換を有効にする]を選択した場合は、以下のいずれかのオプションを選択して、生成されたターゲットテーブル(またはオブジェクト)名およびカラム(またはフィールド)名の大文字と小文字の処理方法を指定します。
デフォルト値は、[ソースと同じ]です。 |
プロパティ | 説明 |
|---|---|
ライタディストリビュータ数 | [ライタアンロード複数ディストリビュータ]カスタムプロパティがtrueに設定されている場合、初期ロードジョブ中または組み合わせロードジョブのアンロードフェーズ中に、データを処理するために個別のスレッドで並列して実行できるディストリビュータの数。並列ディストリビュータスレッドを使用すると、特に大量のデータ転送で、ジョブのパフォーマンスが向上します。 デフォルト値は3です。システムに十分なリソースがある場合は、このパラメータを8に設定することをお勧めします。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なディストリビュータ数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタアンロード複数ディストリビュータ | 初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でデータを処理するために複数のディストリビュータスレッドを使用できるかどうかを示します。ディストリビュータは、ステージング領域へのデータファイルのアップロードやターゲットへのデータのフラッシュなどの作業を行います。このプロパティをtrueに設定すると、複数のディストリビュータスレッドが使用されます。 デフォルト値はfalseです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって複数のディストリビュータを使用するかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
出力形式 | 出力ファイルの形式。次のオプションがあります。
デフォルトの値は[CSV]です。 注: CSV形式の出力ファイルでは、各フィールドの区切り文字として二重引用符("")が使用されます。 |
CSVファイルへのヘッダーの追加 | [CSV]が出力形式として選択されている場合は、このチェックボックスをオンにして、ソース列名を含むヘッダーを出力CSVファイルに追加します。 |
Avro形式 | 出力形式として[AVRO]を選択した場合、ソーステーブルごとに作成されるAvroスキーマの形式を選択します。次のオプションがあります。
デフォルト値は[Avro-Flat]です。 |
Avroシリアル化形式 | 出力形式として[AVRO]が選択されている場合は、Avro出力ファイルのシリアル化形式を選択します。次のオプションがあります。
デフォルト値は[Binary]です。 |
Avroスキーマディレクトリ | 出力形式として[AVRO]が選択されている場合は、データベース取り込みとレプリケーションが各ソーステーブルのAvroスキーマ定義を格納しているローカルディレクトリを指定します。スキーマ定義ファイルには、次の命名パターンがあります。 schemaname_tablename.txt 注: このディレクトリが指定されていない場合、Avroスキーマ定義ファイルは作成されません。 |
ファイル圧縮タイプ | CSVまたはAVRO出力形式の出力ファイルに対して、圧縮タイプを使用するかどうかを制御します。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Avro圧縮タイプ | [AVRO]が出力形式として選択されている場合は、Avro圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Parquet圧縮タイプ | [PARQUET]出力形式が選択されている場合、Parquetでサポートされている圧縮タイプを選択できます。次のオプションがあります。
デフォルト値は[なし]、これは圧縮が使用されないことを意味します。 |
Deflate圧縮レベル | [Deflate]が[Avro圧縮タイプ]フィールドで選択されている場合、圧縮レベルとして0~9を指定します。デフォルトは0です。 |
ディレクトリタグの追加 | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、Hiveパーティショニングの命名規則と互換性を持たせるために適用サイクルディレクトリの名前に「dt=」プレフィックスを追加するには、このチェックボックスをオンにします。このチェックボックスはデフォルトでオフになっています。 |
タスクターゲットディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、出力データファイル、スキーマファイル、およびCDCサイクルのコンテンツと完了ファイルを保持する他のディレクトリのルートディレクトリ。このフィールドを使用して、タスクのカスタムルートディレクトリを指定できます。[親としての接続ディレクトリ]オプションを有効にしている場合は、必要に応じて、接続プロパティで指定された親ディレクトリで使用するタスクターゲットディレクトリを指定できます。 このフィールドは、次のディレクトリフィールドのいずれかのパターンで{TaskTargetDirectory}プレースホルダが指定されている場合は必須です。 |
親としての接続ディレクトリ | ターゲット接続プロパティで指定されたディレクトリ値を、タスクターゲットプロパティで指定されたカスタムディレクトリパスの親ディレクトリとして使用するようにするには、このチェックボックスをオンにします。 初期ロードタスクの場合、親ディレクトリは、データディレクトリとスキーマディレクトリで使用されます。 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合、親ディレクトリはデータディレクトリ、スキーマディレクトリ、サイクル完了ディレクトリ、およびサイクルコンテンツディレクトリで使用されます。 このチェックボックスはデフォルトで選択されています。オフにしたとき、初期ロードの場合は、[データディレクトリ]フィールドで出力ファイルへのフルパスを定義します。増分ロードの場合は、必要に応じて[タスクターゲットディレクトリ]でタスクのルートディレクトリを指定します。 |
データディレクトリ | 初期ロードタスクの場合、データベース取り込みとレプリケーションが出力データファイルとオプションでスキーマを保存するディレクトリのディレクトリ構造を定義します。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
例: myDir1/{SchemaName}/{TableName} myDir1/myDir2/{SchemaName}/{YYYY}/{MM}/{TableName}_{Timestamp} myDir1/{toLower(SchemaName)}/{TableName}_{Timestamp} 注: ディレクトリ式を手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。プレースホルダの値の大文字と小文字は区別されません。 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、cdc-dataデータファイルを含むサブディレクトリへのカスタムパスを定義します。 デフォルトのディレクトリパターンは{TaskTargetDirectory}/data/{TableName}/dataです。 ディレクトリパターンをカスタマイズするには、[編集]アイコンをクリックして、以下にリストされているパスタイプと値の中から選択します。
Amazon S3、フラットファイル、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Object Storeターゲットでは、[親としての接続ディレクトリ]が選択されている場合、データベース取り込みとレプリケーションは、ターゲット接続プロパティで指定されたディレクトリをデータディレクトリパスのルートとして使用します。 Google Cloud Storageターゲットの場合、データベース取り込みとレプリケーションは取り込みタスクのターゲットプロパティで指定したバケット名を使用します。 Microsoft Fabric OneLakeターゲットの場合、親ディレクトリは、Microsoft Fabric OneLake接続プロパティの[レイクハウスのパス]フィールドで指定されたパスです。 オープンテーブル形式のAmazon S3の場合、[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースディレクトリに接続ディレクトリが追加されます。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 オープンテーブル形式のAmazon S3ターゲットの場合、データディレクトリフィールドは適用されません。[親としての接続ディレクトリ]を有効にすると、ウェアハウスベースパスの前に接続ディレクトリが含まれるようになります。無効にすると、ファイルはウェアハウスベースディレクトリの直下に保存されます。 |
スキーマディレクトリ | デフォルトのディレクトリ以外のディレクトリにスキーマファイルを保存する場合は、スキーマファイルを保存するカスタムディレクトリを指定します。初期ロードの場合は、以前使用した値がリストに表示されます(存在する場合)。このフィールドはオプションです。 初期ロードの場合、デフォルトでは、スキーマはデータディレクトリに保存されます。増分ロード、および初期ロードと増分ロードの組み合わせの場合、スキーマファイルはデフォルトで次のディレクトリに保存されます: {TaskTargetDirectory}/data/{TableName}/schema。 [データディレクトリ]フィールドと同じプレースホルダを使用できます。プレースホルダを手動で入力する場合は、プレースホルダを中括弧{ }で囲んでください。toUpperまたはtoLower関数を含める場合は、{toLower(SchemaName)}のように、プレースホルダ名を丸括弧で囲み、関数とプレースホルダの両方を中括弧で囲みます。 注: スキーマは、CSV形式で出力データファイルにのみ書き込まれます。ParquetおよびAvro形式のデータファイルには、独自の埋め込みスキーマが含まれています。 |
サイクル完了ディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクル完了ファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/completedです。 |
サイクルコンテンツディレクトリ | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合の、サイクルコンテンツファイルを含むディレクトリへのパス。 デフォルトは{TaskTargetDirectory}/cycle/contentsです。 |
データディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのデータディレクトリの下にCDCサイクルごとのタイムスタンプサブディレクトリが作成されます。 このオプションが選択されていない場合、別のディレクトリ構造を定義しない限り、個々のデータファイルがタイムスタンプなしで同じディレクトリに書き込まれます。 |
サマリディレクトリにサイクルのパーティション化を使用する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、このオプションを選択すると、それぞれのCDCサイクルごとにサマリコンテンツおよび完了したサブディレクトリの下にタイムスタンプサブディレクトリが作成されます。 |
コンテンツ内の個々のファイルを一覧表示する | 増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクの場合は、コンテンツサブディレクトリの下に個々のデータファイルが一覧表示されます。 [サマリディレクトリにサイクルのパーティション化を使用する]がオフの場合は、このオプションがデフォルトでオンになります。タイムスタンプや日付などのプレースホルダを使用してカスタムサブディレクトリを設定できる場合を除き、コンテンツサブディレクトリ内の個々のファイルがすべて一覧表示されます。 [データディレクトリにサイクルのパーティション化を使用する]が選択されている場合でも、必要に応じてこのチェックボックスを選択して、個々のファイルを一覧表示し、CDCサイクルごとにグループ化することができます。 |
フィールド | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 増分ロードの場合、ジョブは、挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。初期ロードの場合、ジョブは常に、挿入を表す「I」を書き込みます。 デフォルトでは、このチェック ボックスは、増分ロードジョブ、初期および増分ロードジョブの場合はオンになっており、初期ロードジョブの場合はオフになっています。 |
操作時間の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作タイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。 初期ロードの場合、ジョブは常に現在の日付と時刻を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットにプロパゲートする出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常に所有者として「INFA」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 初期ロードの場合、ジョブは常にIDとして「1」を書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
ソート可能シーケンスの追加 | ジョブがターゲットテーブルに挿入する変更操作ごとに、エポック値と増分値の組み合わせを記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス値は常に昇順ですが、シーケンシャルであることは保証されず、ギャップが存在する可能性があります。シーケンス値を使用して、ターゲットレコード内のアクティビティの順序を特定できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットに書き込む出力にUNDOデータを含めるには、このチェックボックスを選択します。 初期ロードの場合、ジョブはnullを書き込みます。 デフォルトでは、このチェックボックスは選択されていません。 |
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ターゲット作成 | 利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。 注: ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。 |
スキーマ | データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。 処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。 注: [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。 デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
プロパティ | 説明 |
|---|---|
操作タイプの追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットテーブルに挿入する出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]オプションが[監査]または[論理削除]に設定されている場合にのみ使用できます。 [監査]モードでは、ジョブは挿入を表す「I」、更新を表す「U」、または削除を表す「D」を書き込みます。 論理削除モードでは、ジョブは削除の場合は「D」を書き込み、挿入と更新の場合はNULLを書き込みます。操作タイプがNULLの場合、他の[操作の追加...]メタデータカラムもNULLです。操作タイプが「D」の場合にのみ、他のメタデータカラムにNULL以外の値が含まれます。 デフォルトでは、このチェックボックスは選択されています。論理削除を使用している場合は、選択を解除できません。 |
操作時間の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットシステムの監査テーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットテーブルに挿入する出力にUNDOの「操作前のイメージ」データを含む_OLDカラムを追加するには、このチェックボックスを選択します。これにより、各データカラムの以前の値と現在の値を比較できるようになります。削除操作の場合、現在の値はNULLになります。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 デフォルト値はINFA_です。 |
プロパティ | 説明 |
|---|---|
ライタディストリビュータ数 | [ライタアンロード複数ディストリビュータ]カスタムプロパティがtrueに設定されている場合、初期ロードジョブ中または組み合わせロードジョブのアンロードフェーズ中に、データを処理するために個別のスレッドで並列して実行できるディストリビュータの数。並列ディストリビュータスレッドを使用すると、特に大量のデータ転送で、ジョブのパフォーマンスが向上します。 デフォルト値は3です。システムに十分なリソースがある場合は、このパラメータを8に設定することをお勧めします。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なディストリビュータ数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタアンロード複数ディストリビュータ | 初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でデータを処理するために複数のディストリビュータスレッドを使用できるかどうかを示します。ディストリビュータは、ステージング領域へのデータファイルのアップロードやターゲットへのデータのフラッシュなどの作業を行います。このプロパティをtrueに設定すると、複数のディストリビュータスレッドが使用されます。 デフォルト値はfalseです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって複数のディストリビュータを使用するかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
スキーマパス | データベース取り込みとレプリケーションがターゲットテーブルを作成するスキーマパス。 |
データスペース | データをロードするSalesforce Data 360のデータスペースの名前。 データスペースを入力しない場合は、デフォルトのデータスペースが使用されます。 |
カテゴリ | Salesforce Data 360にデータをロードする際にソースストリームからのデータに割り当てられるデータカテゴリ。 次のオプションがあります。
|
イベント時刻フィールド | [エンゲージメント]カテゴリを選択した場合における、エンゲージメントレコードのイベント日時フィールドの名前。購入、クリック、ログインなどのインタラクションがいつ行われたのかを正確に定義し、最近のイベントや関連するイベントを特定するのに役立ちます。 |
レコード変更済みフィールド | [プロファイル]または[その他]カテゴリを選択した場合、レコードが最後に更新された日時をキャプチャするレコード変更済みフィールドの名前です。 |
適用モード | このプロパティは、増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合に、挿入、更新、削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。 [標準]適用モードのみ使用できます。このモードは、1回の適用サイクルの間の変更を累積し、それをターゲットに適用する前に、より少ないSQL文になるようにそれらをインテリジェントにマージします。例えば、ソース行で更新とそれに続く削除が発生した場合、ターゲットに行は適用されません。同じカラムまたはフィールドで複数の更新が発生した場合、最後の更新のみがターゲットに適用されます。異なるカラムまたはフィールドで複数の更新が発生した場合、更新はターゲットに適用される前に1つの更新レコードにマージされます。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
フィールド | 説明 |
|---|---|
取り込みモード | Salesforce 360にデータをロードするための取り込みモード。 データ量、処理速度、近似リアルタイムの要件に基づいて、次のオプションから選択できます。
|
プロパティ | 説明 |
|---|---|
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ターゲット作成 | 利用可能なただ1つのオプションは、[ターゲットテーブルを作成する]であり、これによりソーステーブルをベースにしてターゲットテーブルを生成します。 注: ターゲットテーブルが作成された後、データベース取り込みとレプリケーションは、後続のジョブ実行でターゲットテーブルをインテリジェントに処理します。データベース取り込みとレプリケーションは、特定の状況に応じて、ターゲットテーブルを切り詰めたり再作成したりする場合があります。 |
スキーマ | データベース取り込みとレプリケーションがターゲットテーブルを作成するターゲットスキーマを選択します。 |
ステージ | データがターゲットテーブルに書き込まれる前にソースから読み取られたデータを保持する内部ステージング領域の名前。この名前にスペースを含めることはできません。指定されたステージング領域が存在しない場合、自動的に作成されます。 注: [詳細ターゲットプロパティ]で[Superpipe]オプションを選択した場合、このフィールドは使用できません。 |
適用モード | 増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブの場合、このプロパティは、挿入、更新、および削除といったソースDMLの変更がターゲットにどのように適用されるかを示します。次のオプションがあります。
処理を完了するために論理的に削除されたデータが必要となる、長期にわたるビジネスプロセスがある場合、誤って削除したデータを復元する必要がある場合、または削除された値を監査目的で追跡する必要がある場合は、論理削除の使用を検討してください。 注: [論理削除]モードを使用する場合は、ソーステーブルのプライマリキーに対して更新を実行しないでください。そうしないと、ターゲットでデータ破損が発生する可能性があります。 監査履歴を使用して、データをターゲットデータベースに書き込む前にダウンストリームの計算または処理を実行する場合、またはキャプチャされた変更に関するメタデータを調べる場合は、監査適用モードの使用を検討してください。 デフォルト値は[標準]です。 注: タスクウィザードの[ソース]ページで手法として[クエリベースのCDC]を選択した場合、このフィールドは表示されません。 |
プロパティ | 説明 |
|---|---|
最終レプリケート時刻を追加 | ターゲットテーブルでレコードが挿入または最後に更新された時点のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスをオンにします。初期ロードの場合、ロードされたすべてのレコードのタイムスタンプは同じですが、Superpipeオプションを使用するSnowflakeターゲットに限り、分と秒がわずかに異なる可能性があります。増分ロード、および初期ロードと増分ロードの組み合わせの場合、このカラムには、ターゲットに適用された最後のDML操作のタイムスタンプが記録されます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作タイプの追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作タイプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]オプションが[監査]または[論理削除]に設定されている場合にのみ使用できます。 監査モードでは、ジョブはこのメタデータカラムに、挿入の場合は「I」、更新の場合は「U」、更新/挿入の場合は「E」、削除の場合は「D」を書き込みます。 論理削除モードでは、ジョブは削除の場合は「D」を書き込み、挿入、更新、および更新/挿入の場合はNULLを書き込みます。操作タイプがNULLの場合、他の[操作の追加...]メタデータカラムもNULLです。操作タイプが「D」の場合にのみ、他のメタデータカラムにNULL以外の値が含まれます。 デフォルトでは、このチェックボックスは選択されています。論理削除を使用している場合は、選択を解除できません。 |
操作時間の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作のタイムスタンプを記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作所有者の追加 | ジョブがターゲットデータベースにプロパゲートする出力、またはターゲットシステムの監査テーブルに挿入する出力にソースSQL操作の所有者を記録するメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 このプロパティは、MongoDBソースまたはPostgreSQLソースを持つジョブでは使用できません。 注: このプロパティは、SQL Serverソースを持ち、CDCテーブルキャプチャメソッドを使用するおよびジョブではサポートされていません。 |
操作トランザクションIDの追加 | ジョブがSQL操作のターゲットにプロパゲートする出力にソーストランザクションIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。 このフィールドは、[適用モード]が[監査]または[論理削除]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
操作シーケンスの追加 | ジョブがターゲットシステムの監査テーブルに挿入する変更操作ごとに、生成された昇順のシーケンス番号を記録するメタデータカラムを追加するには、このチェックボックスを選択します。シーケンス番号には、操作の変更ストリーム位置が反映されます。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
前のイメージを追加 | ジョブがターゲットテーブルに挿入する出力にUNDOの「操作前のイメージ」データを含む_OLDカラムを追加するには、このチェックボックスを選択します。これにより、各データカラムの以前の値と現在の値を比較できるようになります。削除操作の場合、現在の値はNULLになります。 このフィールドは、[適用モード]が[監査]に設定されている場合にのみ使用できます。 デフォルトでは、このチェックボックスは選択されていません。 |
サイクルIDの追加 | 各ターゲットテーブルの各CDCサイクルのサイクルIDを含むメタデータカラムを追加するには、このチェックボックスを選択します。サイクルIDは、CDCサイクルが成功するたびにCDCエンジンによって生成される番号です。ジョブをデータ統合タスクフローと統合すると、ジョブは出力フィールドで最小サイクルIDと最大サイクルIDをタスクフローに渡して、タスクフローが新しいCDCデータを含むサイクルの範囲を判断できるようにします。この機能は、前のタスクフロー実行が完了する前に複数のサイクルのデータが蓄積される場合に便利です。デフォルトでは、このチェックボックスは選択されていません。 |
メタデータカラムのプレフィックス | 追加されたメタデータカラムの名前にプレフィックスを追加し、それらを簡単に識別して、既存のカラムの名前との競合を防ぐことができるようにします。 デフォルト値はINFA_です。 |
Superpipe | 最初にデータをステージファイルに書き込むのではなく、Snowpipe Streaming APIを使用して、短い待ち時間でSnowflake Data Cloudターゲットテーブルにデータ行を直接すばやくストリーミングするには、このチェックボックスを選択します。このオプションは、すべてのロードタイプで有効にすることができます。 ターゲット接続を設定するときに、KeyPair認証を選択します。 デフォルトでは、このチェックボックスは選択されています。中間ステージファイルにデータを書き込む場合は、選択解除します。 注: [論理削除]適用モードを使用するタスクで[Superpipe]オプションを有効にする場合は、ソーステーブルにプライマリキーが含まれていることを確認してください。 |
マージ頻度 | [Superpipe]が選択されている場合、必要に応じて、変更データ行がマージされてSnowflakeターゲットテーブルに適用される頻度を秒単位で設定できます。 マージ頻度は、ストリーム変更データがSnowflakeベーステーブルにマージされる頻度に影響します。Snowflakeビューは、ストリーム変更データをベーステーブルと結合します。この値を設定すると、ベーステーブルにデータをマージするコストとビュー結合処理のパフォーマンスのバランスを取ることができます。 このフィールドは、増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクに適用されます。有効な値は60から604800秒です。デフォルトは3600秒です。 |
大文字と小文字の変換を有効にする | デフォルトでは、ターゲットテーブル名およびカラム名は、対応するソース名と同じ大文字と小文字で生成されます。ただし、ターゲットのクラスタレベルまたはセッションレベルのプロパティがこの大文字と小文字を区別する動作をオーバーライドしている場合を除きます。ターゲット名の大文字と小文字を制御する場合は、このチェックボックスを選択します。次に、[大文字と小文字の変換ストラテジ]オプションを選択します。 |
大文字と小文字の変換ストラテジ | [大文字と小文字の変換を有効にする]を選択した場合は、以下のいずれかのオプションを選択して、生成されたターゲットテーブル(またはオブジェクト)名およびカラム(またはフィールド)名の大文字と小文字の処理方法を指定します。
デフォルト値は、[ソースと同じ]です。 注: 選択したストラテジは、大文字と小文字の制御に関するターゲットのクラスタレベルまたはセッションレベルのプロパティをオーバーライドします。 |
プロパティ | 説明 |
|---|---|
ライタディストリビュータ数 | [ライタアンロード複数ディストリビュータ]カスタムプロパティがtrueに設定されている場合、初期ロードジョブ中または組み合わせロードジョブのアンロードフェーズ中に、データを処理するために個別のスレッドで並列して実行できるディストリビュータの数。並列ディストリビュータスレッドを使用すると、特に大量のデータ転送で、ジョブのパフォーマンスが向上します。 デフォルト値は3です。システムに十分なリソースがある場合は、このパラメータを8に設定することをお勧めします。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なディストリビュータ数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタヘルパスレッド数 | 受信変更データ行または初期アンロード行を、ターゲット用に設定された出力形式(Avro、CSV、Parquetなど)に変換するために使用されるライタヘルパスレッドの数。 デフォルト値は2です。2つのスレッドがデータの受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。受信ボリュームが多い場合や、複数のライタディストリビュータが使用されている場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
ライタアンロード複数ディストリビュータ | 初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でデータを処理するために複数のディストリビュータスレッドを使用できるかどうかを示します。ディストリビュータは、ステージング領域へのデータファイルのアップロードやターゲットへのデータのフラッシュなどの作業を行います。このプロパティをtrueに設定すると、複数のディストリビュータスレッドが使用されます。 デフォルト値はfalseです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって複数のディストリビュータを使用するかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |