データベース取り込みとレプリケーション > データベース取り込みとレプリケーションタスクの設定 > タスク定義の最終処理
  

タスク定義の最終処理

ほぼ完了です! [開始!]ページで、さらにいくつかのプロパティの入力を完了します。次に、タスクを保存してデプロイすることができます。
    1ページの上部に、処理用に選択されたソーステーブルの数が表示されます。
    2[全般プロパティ]で、次のプロパティを設定します。
    プロパティ
    説明
    タスク名
    生成された名前を使用しない場合は、データベース取り込みおよびレプリケーションタスクの識別に使用する名前を入力します。わかりやすい名前を使用すると、後でタスクを見つけやすくなります。
    タスク名には、ラテン英数字、スペース、ピリオド(.)、コンマ(,)、アンダースコア(_)、プラス記号(+)、およびハイフン(-)を含めることができます。タスク名に他の特殊文字を含めることはできません。タスク名では大文字と小文字が区別されません。最大長は50文字です。
    注:
    タスク名にスペースを含めた場合、タスクのデプロイ後、対応するジョブ名にはスペースが表示されません。
    場所
    タスク定義を含むExplore内のプロジェクトまたはプロジェクト\フォルダ。プロジェクトを指定しない場合は、「デフォルト」のプロジェクトが使用されます。
    ランタイム環境
    タスクの実行に使用するランタイム環境を選択します。デフォルトでは、タスクの定義を開始したときに最初に入力したランタイム環境が表示されます。このランタイム環境を使用するか、別のランタイム環境を選択することができます。
    ヒント:
    ランタイム環境のリストを更新するには、[更新]をクリックします。
    ランタイム環境は、1つ以上のSecure Agentで構成されるSecure Agentグループにすることができます。Secure Agentは、タスクを実行し、安全な通信を可能にする軽量のプログラムです。
    また、一部のクラウドソースタイプでは、Microsoft Azureでホストされているサーバーレスランタイム環境を使用できます。
    注:
    以前にローカルランタイム環境を選択していた場合、サーバーレスランタイム環境を選択することはできません。
    クラウドホステッドエージェントはサポートされていません。
    指定したランタイム環境を、作成するすべてのタスクのデフォルト環境として使用するには、[デフォルトとして設定]を選択します。デフォルト環境として使用しない場合は、このチェックボックスをオフのままにします。
    説明
    必要に応じて、タスクに使用する説明を入力します。
    最大長は4,000文字です。
    スケジュール
    手動で開始するのではなく、スケジュールに基づいて初期ロードタスクを実行する場合は、[このタスクは指定したスケジュールを使用する]を選択します。次に、事前にAdministratorで定義したスケジュールを選択します。
    デフォルトのオプションは[このタスクはスケジュールを使用しない]です。
    注:
    このフィールドは、増分ロードタスク、および初期ロードと増分ロードの組み合わせタスクには使用できません。
    スケジュールオプションを表示および編集するには、Administratorに移動します。スケジュールを編集すると、変更はスケジュールを使用するすべてのジョブに適用されます。タスクのデプロイ後にスケジュールを編集する場合、タスクを再デプロイする必要はありません。
    ジョブを実行するためのスケジュール条件が満たされていて、前のジョブ実行がまだアクティブである場合、データベース取り込みとレプリケーションは新しいジョブの実行をスキップします。
    自動チューニング
    プレビュー通知: 2026年4月リリースでは、自動チューニングがプレビューで使用可能になりました。
    パフォーマンスを最適化するために、初期ロードジョブと組み合わせロードジョブのアンロードフェーズの自動チューニングを有効にするには、このチェックボックスを選択します。このオプションは、ソースからのデータの読み込みやターゲットへの書き込みに影響を与えるパフォーマンス関連パラメータのうち、選択されたものをチューニングします。チューニング設定は、ネットワークおよびデータベースの待ち時間、行数、テーブルサイズ、CPUコア数、メモリ使用量など、環境から収集されるパフォーマンスやシステムメトリックに基づいています。また、JVMヒープ割り当てやタスク容量などアプリケーション固有のメトリックにも基づきます。
    注:
    このオプションは、MongoDBまたはNetezzaソースを持つタスクでは無視されます。
    タスクフローで実行
    このチェックボックスを選択すると、タスクをデータ統合でイベントソースとしてタスクフローに追加できるようになります。その後、取り込んだデータを変換するトランスフォーメーションをタスクフローに含めることができます。[Superpipe]オプションを使用しないSnowflakeターゲットを持つ初期ロードタスクおよび増分ロードタスクで使用できます。
    3詳細プロパティを表示するには、[詳細オプションを表示]をオンに切り替えます。
    最後の[開始!]ページの詳細プロパティ。
    4[出力ファイルの行数]フィールドで、デフォルト値を使用しない場合、データベース取り込みとレプリケーションタスクが出力データファイルに書き込む最大行数を指定します。
    注:
    Apache Kafkaターゲットを持つジョブの場合、またはSnowflakeターゲットにSuperpipeオプションを使用する場合、[出力ファイル内の行数]フィールドは表示されません。
    増分ロード操作と、初期ロード操作と増分ロード操作の組み合わせの場合、この行数に達したとき、またはフラッシュ待ち時間が経過して、トランザクションの処理の途中でジョブが実行されない場合に、変更データがターゲットにフラッシュされます。フラッシュ待ち時間は、ジョブがデータをターゲットにフラッシュする前に、さらに変更データを待機する時間です。待ち時間は内部で10秒に設定されており、変更できません。
    有効な値は1から100000000です。Amazon S3、Microsoft Azure Data Lake Storage Gen2、およびOracle Cloud Infrastructure(OCI)Object Storageターゲットのデフォルト値は1000行です。その他のターゲットの場合は、デフォルト値は100000行です。
    注:
    Microsoft Azure Synapse Analyticsターゲットの場合、データは最初にMicrosoft Azure Data Lake Storageステージングファイルに送信されてから、ターゲットテーブルに書き込まれます。データがターゲットに書き込まれた後、ステージングファイルを含むテーブル固有のディレクトリのコンテンツ全体が消去されます。Snowflakeターゲットの場合、データは最初に内部ステージ領域に格納されてから、ターゲットテーブルに書き込まれます。
    5初期ロードジョブの場合のみ、フラットファイル、Amazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage、Microsoft Fabric OneLake、またはOracle Cloud Object Storageターゲットの出力データファイルに.dat拡張子を付ける場合は、必要に応じて[ファイルタイプに基づくファイル拡張子]チェックボックスをクリアします。このチェックボックスはデフォルトで選択されており、出力ファイルのファイルタイプに基づいてファイル名拡張子が付けられます。
    注:
    これらのターゲットタイプの増分ロードジョブの場合、このオプションは使用できません。データベース取り込みとレプリケーションは、常にファイルタイプに基づいて出力ファイル名拡張子を使用します。
    6Amazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen2、Microsoft Fabric OneLake、またはOracle Cloud Object Storageターゲットを持つデータベース取り込みとレプリケーションの増分ロードタスクの場合、次の適用サイクルオプションを設定します。
    オプション
    説明
    サイクル間隔の適用
    データベース取り込みとレプリケーションジョブが適用サイクルを終了するまでに経過する必要のある時間を指定します。日、時間、分、秒を指定するか、これらの時間フィールドのサブセットに値を指定して、他のフィールドを空白のままにすることができます。
    デフォルト値は15分です。
    注:
    Amazon S3ターゲットを使用していて、[オープンテーブルフォーマット]ターゲットプロパティに[Apache Iceberg]オプションを選択している場合、このフィールドは無視されます。
    サイクル変更制限の適用
    ジョブが適用サイクルを終了する前に処理する必要がある、データベース取り込みとレプリケーションジョブのすべてのテーブル内のレコードの合計数を指定します。このレコード制限に達すると、データベース取り込みとレプリケーションジョブは適用サイクルを終了し、変更データをターゲットに書き込みます。
    デフォルト値は10000レコードです。
    起動中に、古いデータのバックログの処理に追いつく必要がある場合、ジョブは適用サイクル間隔よりも頻繁にこの制限に達する可能性があります。
    注:
    Amazon S3ターゲットを使用していて、[オープンテーブルフォーマット]ターゲットプロパティに[Apache Iceberg]オプションを選択している場合、このフィールドは無視されます。
    低アクティビティのフラッシュ間隔
    データベース取り込みとレプリケーションジョブが適用サイクルを終了する前に、ソースで変更アクティビティがない期間中に経過する必要がある時間を時間、分、またはその両方で指定します。この時間制限に達すると、データベース取り込みとレプリケーションジョブは適用サイクルを終了し、変更データをターゲットに書き込みます。
    このオプションの値を指定しない場合、データベース取り込みとレプリケーションジョブは、[サイクル変更制限の適用]または[サイクル間隔の適用]のいずれかの制限に達した後にのみ適用サイクルを終了します。
    デフォルト値は指定されていません。
    注:
    Amazon S3ターゲットを使用していて、[オープンテーブルフォーマット]ターゲットプロパティに[Apache Iceberg]オプションを選択している場合、このフィールドは無視されます。
    注:
    7[スキーマドリフトオプション]で、スキーマドリフトの検出がソースとターゲットの組み合わせでサポートされている場合は、サポートされている各タイプのDDL操作に使用するスキーマドリフトオプションを指定します。
    スキーマドリフトオプションは、次のようなソースとターゲットの組み合わせを持つ増分ロードジョブ、および初期ロードと増分ロードの組み合わせジョブでサポートされます。
    ソース
    ターゲット
    Db2 for i
    Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、Snowflake、およびSQL Server
    DB2 for LUW
    Snowflake
    DB2 for z/OS(DB2 11を除く)
    Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、Snowflake、およびSQL Server
    Microsoft SQL Server
    Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、Snowflake、およびSQL Server
    Oracle
    Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、Snowflake、およびSQL Server
    PostgreSQL
    増分ロード: Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Kafka(増分ロードのみ)、Microsoft Azure Data Lake Storage、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、およびSnowflake
    初期ロードと増分ロードの組み合わせ: Oracle、PostgreSQL、およびSnowflake
    次のタイプのDDL操作がサポートされます。
    注:
    [カラムの変更]および[カラムの名前変更]オプションはサポートされておらず、Google BigQueryターゲットを持つデータベース取り込みとレプリケーションジョブでは表示されません。
    次の表に、DDL操作タイプに設定できるスキーマドリフトオプションを示します。
    オプション
    説明
    無視
    ソースデータベースで発生するDDLの変更をターゲットにレプリケートしません。Amazon Redshift、Kafka、Microsoft Azure Synapse Analytics、PostgreSQL、Snowflake、およびSQL Serverターゲットの場合、このオプションは、[カラムの削除]および[カラム名の変更]操作タイプのデフォルトオプションです。
    CSV出力形式を使用するAmazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage、およびOracle Cloud Object Storageターゲットの場合、[無視]オプションは無効です。AVRO出力形式の場合、このオプションは有効になっています。
    レプリケート
    DDL操作をターゲットにレプリケートします。Amazon S3、Google Cloud Storage、Microsoft Azure Data Lake Storage、Microsoft Fabric OneLake、およびOracle Cloud Object Storageターゲットの場合、このオプションはすべての操作タイプのデフォルトオプションです。他のターゲットの場合、このオプションは、[カラムの追加]および[カラムの変更]操作タイプのデフォルトオプションです。
    注:
    • - ターゲットでサポートされていないタイプのスキーマ変更をレプリケートしようとすると、そのタスクに関連付けられたデータベース取り込みとレプリケーションジョブはエラーが発生して終了します。例えば、Microsoft Azure Synapse Analyticsターゲットでのカラム名の変更操作に[レプリケート]を選択すると、ジョブが終了します。
    • - プライマリキーカラムを追加するカラムの追加操作はサポートされておらず、予期しない結果を引き起こす可能性があります。
    • - Databricksターゲットの場合、[レプリケート]オプションは[カラムの削除]では使用できません。[カラム名の変更]オプションに[レプリケート]を指定した場合、タスクがデプロイされた後、ジョブが実行される前に、次のDatabricksテーブルプロパティを指定する必要があります: 'delta.minReaderVersion' = '2', 'delta.minReaderVersion' = '2', 'delta.minWriterVersion' = '5', and 'delta.columnMapping.mode' = 'name'
    • - カラムのNULL制約またはNOT NULL制約を変更するカラム変更操作は、仕様により、ターゲットにレプリケートされません。これは、ターゲットカラムのNULL許容可否を変更すると、後続の変更が適用されるときに問題が発生する可能性があるためです。
    • - DDL操作は、一部のデータ変更がキャプチャされた後にのみターゲットにレプリケートされます。
    ジョブの停止
    データベース取り込みとレプリケーションジョブ全体を停止します。
    テーブルの停止
    DDL変更が発生したソーステーブルの処理を停止します。1つ以上のテーブルが[テーブルの停止]スキーマドリフトオプションによってレプリケーションから除外された場合、ジョブの状態が[実行中(警告あり)]に変わります。
    重要:
    データベース取り込みとレプリケーションジョブは、ジョブが変更の処理を停止した後にソーステーブルで発生したデータ変更を取得できません。その結果、ターゲットでデータ損失が発生する可能性があります。データの損失を回避するには、ジョブが処理を停止したソースオブジェクトとターゲットオブジェクトを再同期する必要があります。[オプションで再開][再同期]オプションを使用します。
    8Apache Kafkaターゲットを持つ増分ロードジョブの場合は、次のチェックポイントオプションを設定します。
    オプション
    説明
    チェックポイントのすべての行
    データベース取り込みとレプリケーションジョブが、Kafkaターゲットに送信されるすべてのメッセージに対してチェックポイント処理を実行するかどうかを示します。
    注:
    このチェックボックスが選択されている場合、[チェックポイントすべてのコミット]、[チェックポイントの行数]、および[チェックポイントの頻度(秒)]オプションは無視されます。
    チェックポイントのすべてのコミット
    データベース取り込みとレプリケーションジョブがソースで発生するすべてのコミットに対してチェックポイント処理を実行するかどうかを示します。
    チェックポイントの行数
    チェックポイントを追加する前に、データベース取り込みとレプリケーションジョブがターゲットに送信するメッセージの最大数を指定します。このオプションを0に設定すると、ジョブはメッセージの数に基づいてチェックポイント処理を実行しません。このオプションを1に設定すると、ジョブは各メッセージにチェックポイントを追加します。
    チェックポイントの頻度(秒)
    データベース取り込みとレプリケーションジョブがチェックポイントを追加するまでに経過する必要がある最大秒数を指定します。このオプションを0に設定すると、データベース取り込みとレプリケーションジョブは経過時間に基づいてチェックポイント処理を実行しません。
    9[カスタムプロパティ]で、特別な要件を満たすためにInformaticaが提供する1つ以上のカスタムプロパティを指定できます。プロパティを追加するには、[プロパティの作成]フィールドにプロパティの名前と値を入力します。次に、[プロパティの追加]をクリックします。
    これらのプロパティを指定する場合は、Informaticaグローバルカスタマサポートにお問い合わせください。通常、これらのプロパティは、固有の環境または特別な処理のニーズに対応します。必要に応じて、複数のプロパティを指定できます。プロパティ名には、英数字と次の特殊文字のみを含めることができます: ピリオド(.)、ハイフン(-)、およびアンダースコア(_)
    10[保存]をクリックしてタスクを保存します。
    11タスクのジョブインスタンスをデプロイするには[デプロイ]をクリックし、タスクを表示または編集するには[表示]をクリックします。
    [マイジョブ]ページから、ステータスが[デプロイ済み]のジョブを実行できます。