プロパティ | ロードタイプ | 説明 |
|---|---|---|
ロードタイプ | すべて | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
スキーマ | すべて | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
ジャーナル名 | 増分ロードおよび初期ロードと増分ロード | ソーステーブルに加えられた変更を記録するDb2 for iジャーナルの名前。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
CDCスクリプト | 増分ロード、および初期ロードと増分ロードの組み合わせ | ソーステーブルでCDCを有効にするためのスクリプトを生成し、スクリプトを実行するか、ダウンロードします。使用可能なオプションは、[すべてのカラムのCDCを有効化]のみです。 DB2 for iソースの場合、スクリプトはソーステーブルでのジャーナルを有効にします。 必要な権限がある場合は、[実行]をクリックしてスクリプトを実行します。または、[ダウンロード]アイコンをクリックしてスクリプトをダウンロードし、DBAに渡して実行できるようにします。 |
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
永続ストレージの有効化 | 増分ロード、および初期ロードと増分ロードの組み合わせ 注: このプロパティは、サーバーレスランタイム環境を使用している場合は使用できません。 | ターゲットへのデータの書き込みが遅い場合や遅延している場合でもデータを継続的に使用できるようにディスクバッファへのトランザクションデータの永続ストレージを有効にするには、このチェックボックスを選択します。 永続ストレージを使用する利点は、ソーストランザクションログの消費が高速になり、ログアーカイブやバックアップへの依存度が低くなるため、データベース取り込みジョブを再開した後もディスクストレージ内の永続データに引き続きアクセスできることです。 保持されたデータは、Secure Agentに保存されます。データは暗号化されていません。Secure Agentのファイルとディレクトリは、ネイティブファイルシステムへのアクセス権限またはファイルシステムのネイティブ暗号化サポートを使用して、不要なアクセスから保護されることが期待されます。 このチェックボックスをオンにして[CDCデータのステージング]も選択すると、このチェックボックスはオフになり、使用できなくなります。 |
ジョブ終了トークン | 増分ロード、および初期ロードと増分ロードの組み合わせ | 変更データキャプチャがジャーナルレシーバを処理している間にジャーナルレシーバが削除されることを防ぐための、IBM iマシン上のジャーナルレシーバの出口に送信される一意の識別子。出口プログラムにより、ジャーナルレシーバがCDCに対して使用されている間、ジャーナルレシーバをロックします。 |
増分ロード操作の当初の開始点 | 増分ロードのみ | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
Db2 for iの場合、デフォルト値の0を使用しないでください。 [CDCデータのステージング]オプションを選択した場合、このオプションは使用できません。 [CDCデータのステージング]オプションを選択した場合、このオプションは使用できません。 デフォルトは[使用可能な最新]です。 注:
|
CDCデータのステージング | 増分ロード、および初期ロードと増分ロードの組み合わせ | ソースデータベースから単一パスでデータを読み取り、そのデータを共通ストレージに書き込んで、同じデータベースを処理する複数のタスクでデータを読み取れるようにする場合は、このチェックボックスをオンにします。ステージングされたデータは、ステージンググループ内のタスクが読み取ることができます。ログベースのソースの場合、タスクは異なるスキーマを持つ異なるテーブルを処理することができます。 |
ステージンググループ | 増分ロード、および初期ロードと増分ロードの組み合わせ | CDCステージンググループを使用して複数のタスクのCDCデータをステージングする場合は、以前に定義したグループをリストから選択するか、[新規]をクリックしてグループを作成します。 |
プロパティ | 説明 |
|---|---|
グループ名 | 生成されたグループ名(Log_group_cdc_yyyymmdd<number>形式)をそのまま使用するか、カスタム名を入力します。 |
場所 | ステージンググループ定義を格納するプロジェクト(デフォルトの場所を使用しない場合)。 |
ステージングの場所の接続 | クラウドのステージング場所(Amazon S3、Google Cloud Storage、またはMicrosoft Azure Data Lake Storage Gen2)への接続を選択します。 |
ランタイム環境 | CDCステージングタスクの実行に使用するランタイム環境を選択します。 ログベースのソースの場合は、タスクが実行されるSecure Agentがすべてのソースログにアクセスできることを確認します。 |
ログを読み取るための代替接続の有効化 | Db2 for iソースの場合は、このオプションが使用可能であっても選択しないでください。 |
ログを読み取るための代替接続 | [ログを読み取るための代替接続を有効にする]を選択した後に使用できます。ただし、Db2 for iソースは対象ではありません。 |
ジャーナル名 | 変更を記録するジャーナルの名前を入力します。ステージンググループ内のすべてのタスクに同じジャーナル名を使用する必要があります。 |
ジョブ終了トークン | リーダーがジャーナルの読み取りを行っている間にジャーナルが削除されることを防ぐための、IBM iマシン上のジャーナルレシーバの出口に送信されるグループ内の各CDCジョブの一意の識別子。出口プログラムにより、ジャーナルがリーダーによって使用されている間、ジャーナルをロックします。ステージンググループ内のすべてのタスクに同じジョブ終了トークン値を使用する必要があります。 |
LOBを含める | 使用不可。 |
行フラッシュしきい値 | データがクラウドストレージに転送される前に、データを一時的に保存するファイルに書き込むことができる最大行数。この行数に到達したとき、またはフラッシュ間隔が経過すると、データがクラウドストレージにフラッシュされます。 デフォルトは50000行です。 |
フラッシュ間隔 | ソースでの変更アクティビティが少ない期間中、ジョブが一時ファイル内のデータをクラウドストレージにフラッシュする前に、より多くの変更データを待機する分数と秒数。この間隔が経過するか、行フラッシュしきい値に到達したときにデータがフラッシュされます。 デフォルトは30秒です。 |
ログの開始点 | CDCステージングジョブが初めて実行されたときに変更レコードの読み取りを開始するDb2 for iジャーナル。次のオプションがあります。
注: これらのオプションは、ソースプロパティの[増分ロードの初期開始点]で説明されているオプションと似ています。 デフォルトは[使用可能な最新]です。 |
ステージングデータ保持期間 | クラウドストレージにデータを保持する日数。有効な値は、0~365です。デフォルトは14日です。 保持期間が過ぎると、データはパージされ、その後の再起動では使用できなくなります。 |
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ロードタイプ | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
スキーマ | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 注: 増分ロードタスクまたは組み合わせロードタスクにクエリベースのCDCメソッドを使用している場合、[詳細ソースプロパティ]の[CDCクエリカラム名]の値を入力した後にのみ、スキーマ内のテーブルを取得できます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
CDCスクリプト | ログベースCDCを使用する初期ロード、および初期ロードと増分ロードの組み合わせ | 選択した各ソーステーブルのすべてのカラムに対して、Db2 DATA CAPTURE CHANGESを有効にするスクリプトを生成します。使用可能なオプションは、[すべてのカラムのCDCを有効化]のみです。 スクリプトを実行できますが、実行する権限がない場合は、スクリプトをダウンロードしてDBAに渡し実行してもらいます。 |
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
LOBを含める | Microsoft Azure Data Lake Storage Gen 2、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、またはSnowflakeターゲットへのすべてのロードタイプ。 このフィールドを表示するには、増分ロードタスクおよび組み合わせロードタスクでは、クエリベースのCDCメソッドを使用する必要があります。 | ターゲットにデータをレプリケートするラージオブジェクト(LOB)カラムがソースに含まれている場合は、このチェックボックスを選択します。 Db2 for LUWソースのLOBデータ型: BLOB、CLOB、DBCLOB、LONG VARCHAR、LONG VARCHAR FOR BIT、LONG VARGRAPHIC、およびXML LOBデータは、ターゲットで切り詰められる可能性があります。詳細については、「LOBの切り詰めについて」を参照してください。 |
増分ロード操作の当初の開始点 | 増分ロードのみ | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
デフォルトは[使用可能な最新]です。 注:
|
永続ストレージの有効化 | ログベースのCDCを使用する初期ロード、および初期ロードと増分ロードの組み合わせ。 クエリベースのCDCの場合、このフィールドは表示されません。これは、永続ストレージがデフォルトで有効になっていて変更できないためです。 | ログベースのCDCを使用していて、CDCデータをステージングする予定がないのであれば、ターゲットへのデータの書き込みが遅い場合や遅延している場合でもデータを継続的に使用できるようにディスクバッファでトランザクションデータの永続ストレージを有効にするために、このチェックボックスを選択します。 永続ストレージを使用する利点は、ソーストランザクションログの消費が高速になり、ログアーカイブやバックアップへの依存度が低くなるため、データベース取り込みジョブを再開した後もディスクストレージ内の永続データに引き続きアクセスできることです。 CDCデータをステージングすることを選択した場合、このオプションは選択解除され、使用できなくなります。 |
CDCデータのステージング | ログベースCDCを使用する初期ロード、および初期ロードと増分ロードの組み合わせ | ソースデータベースから単一パスでデータを読み取り、そのデータを共通ストレージに書き込んで、同じデータベースを処理する複数のタスクでデータを読み取れるようにする場合は、このチェックボックスをオンにします。ステージングされたデータは、ステージンググループ内のタスクが読み取ることができます。ログベースのソースの場合、タスクは異なるスキーマを持つ異なるテーブルを処理することができます。 |
ステージンググループ | ログベースCDCを使用する初期ロード、および初期ロードと増分ロードの組み合わせ | CDCステージンググループを使用して複数のタスクのCDCデータをステージングする場合は、以前に定義したグループをリストから選択するか、[新規]をクリックしてグループを作成します。 |
プロパティ | 説明 |
|---|---|
グループ名 | 生成されたグループ名(Log_group_cdc_yyyymmdd<number>形式)をそのまま使用するか、カスタム名を入力します。 |
場所 | ステージンググループ定義を格納するプロジェクト(デフォルトの場所を使用しない場合)。 |
ステージングの場所の接続 | クラウドのステージング場所(Amazon S3、Google Cloud Storage、またはMicrosoft Azure Data Lake Storage Gen2)への接続を選択します。 |
ランタイム環境 | CDCステージングタスクの実行に使用するランタイム環境を選択します。 ログベースのソースの場合は、タスクが実行されるSecure Agentがすべてのソースログにアクセスできることを確認します。 |
CDCメソッド | 利用可能な唯一のオプションは[ログベース]です。CDCステージンググループは、クエリベースのCDCでは使用できません。 |
カタログテーブル名 | Db2ソーステーブル、カラム定義、および有効なDb2ログの位置に関する情報が格納されているキャプチャカタログテーブルの名前。このテーブルは、変更データをキャプチャするソーステーブルが含まれているのと同じデータベースに作成する必要があります。 |
キャプチャのスレッド化 | CDCステージングタスクがDb2から変更データをキャプチャするために使用するスレッドの数。有効な値は1から9です。デフォルト値は[デフォルト]です。 |
ログ読み取りバッファサイズ | CDCステージングタスクがDb2ログレコードから読み取られた変更データに使用するバッファサイズ(キロバイト単位)。デフォルトは0です。 |
行フラッシュしきい値 | データがクラウドストレージに転送される前に、データを一時的に保存するファイルに書き込むことができる最大行数。この行数に到達したとき、またはフラッシュ間隔が経過すると、データがクラウドストレージにフラッシュされます。 デフォルトは50000行です。 |
フラッシュ間隔 | ソースでの変更アクティビティが少ない期間中、ジョブが一時ファイル内のデータをクラウドストレージにフラッシュする前に、より多くの変更データを待機する分数と秒数。この間隔が経過するか、行フラッシュしきい値に到達したときにデータがフラッシュされます。 デフォルトは30秒です。 |
ログの開始点 | CDCステージングジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置。次のオプションがあります。
注: これらのオプションは、ソースプロパティの[増分ロードの初期開始点]で説明されているオプションと似ています。 デフォルトは[使用可能な最新]です。 |
ステージングデータ保持期間 | クラウドストレージにデータを保持する日数。有効な値は、0~365です。デフォルトは14日です。 保持期間が過ぎると、データはパージされ、その後の再起動では使用できなくなります。 |
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ロードタイプ | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
スキーマ | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
CDCスクリプト | 増分ロード、および初期ロードと増分ロードの組み合わせ | ソーステーブルでCDCを有効にするためのスクリプトを生成し、スクリプトを実行するか、ダウンロードします。使用可能なオプションは、[すべてのカラムのCDCを有効化]のみです。 Db2 for z/OSソースの場合、スクリプトはソーステーブルとCDCに必要な特定のDb2カタログテーブルに対してDATA CAPTURE CHANGESを設定します。1つのジョブにDATA CAPTURE CHANGESが設定されると、他のすべてのジョブは、Db2で必要なカタログテーブルに対してその属性が有効になったことを認識します。これは、Db2カタログテーブルがDb2のすべてのユーザーによって共有されるテーブルのセットであるためです。 必要な権限がある場合は、[実行]をクリックしてスクリプトを実行します。または、[ダウンロード]アイコンをクリックしてスクリプトをダウンロードし、DBAに渡して実行できるようにします。 |
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
永続ストレージの有効化 | 増分ロード、および初期ロードと増分ロードの組み合わせ 注: このプロパティは、サーバーレスランタイム環境を使用している場合は使用できません。 | ターゲットへのデータの書き込みが遅い場合や遅延している場合でもデータを継続的に使用できるようにディスクバッファへのトランザクションデータの永続ストレージを有効にするには、このチェックボックスを選択します。 永続ストレージを使用する利点は、ソーストランザクションログの消費が高速になり、ログアーカイブやバックアップへの依存度が低くなるため、データベース取り込みジョブを再開した後もディスクストレージ内の永続データに引き続きアクセスできることです。 保持されたデータは、Secure Agentに保存されます。データは暗号化されていません。Secure Agentのファイルとディレクトリは、ネイティブファイルシステムへのアクセス権限またはファイルシステムのネイティブ暗号化サポートを使用して、不要なアクセスから保護されることが期待されます。 このチェックボックスをオンにして[CDCデータのステージング]も選択すると、このチェックボックスはオフになり、使用できなくなります。 |
増分ロード操作の当初の開始点 | 増分ロードのみ | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
[CDCデータのステージング]オプションを選択した場合、このオプションは使用できません。 [CDCデータのステージング]オプションを選択した場合、このオプションは使用できません。 デフォルトは[使用可能な最新]です。 注:
|
CDCデータのステージング | 増分ロード、および初期ロードと増分ロードの組み合わせ | ソースデータベースから単一パスでデータを読み取り、そのデータを共通ストレージに書き込んで、同じデータベースを処理する複数のタスクでデータを読み取れるようにする場合は、このチェックボックスをオンにします。ステージングされたデータは、ステージンググループ内のタスクが読み取ることができます。ログベースのソースの場合、タスクは異なるスキーマを持つ異なるテーブルを処理することができます。 |
ステージンググループ | 増分ロード、および初期ロードと増分ロードの組み合わせ | CDCステージンググループを使用して複数のタスクのCDCデータをステージングする場合は、以前に定義したグループをリストから選択するか、[新規]をクリックしてグループを作成します。 |
プロパティ | 説明 |
|---|---|
グループ名 | 生成されたグループ名(Log_group_cdc_yyyymmdd<number>形式)をそのまま使用するか、カスタム名を入力します。 |
場所 | ステージンググループ定義を格納するプロジェクト(デフォルトの場所を使用しない場合)。 |
ステージングの場所の接続 | クラウドのステージング場所(Amazon S3、Google Cloud Storage、またはMicrosoft Azure Data Lake Storage Gen2)への接続を選択します。 |
ランタイム環境 | CDCステージングタスクの実行に使用するランタイム環境を選択します。 ログベースのソースの場合は、タスクが実行されるSecure Agentがすべてのソースログにアクセスできることを確認します。 |
ログを読み取るための代替接続の有効化 | Db2 for z/OSソースの場合は、このオプションが使用可能であっても選択しないでください。 |
ログを読み取るための代替接続 | [ログを読み取るための代替接続を有効にする]を選択した後に使用できます。ただし、Db2 for z/OSソースは対象ではありません。 |
LOBを含める | 使用不可。 |
行フラッシュしきい値 | データがクラウドストレージに転送される前に、データを一時的に保存するファイルに書き込むことができる最大行数。この行数に到達したとき、またはフラッシュ間隔が経過すると、データがクラウドストレージにフラッシュされます。 デフォルトは50000行です。 |
フラッシュ間隔 | ソースでの変更アクティビティが少ない期間中、ジョブが一時ファイル内のデータをクラウドストレージにフラッシュする前に、より多くの変更データを待機する分数と秒数。この間隔が経過するか、行フラッシュしきい値に到達したときにデータがフラッシュされます。 デフォルトは30秒です。 |
ログの開始点 | CDCステージングジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置。次のオプションがあります。
注: これらのオプションは、ソースプロパティの[増分ロードの初期開始点]で説明されているオプションと似ています。 デフォルトは[使用可能な最新]です。 |
ステージングデータ保持期間 | クラウドストレージにデータを保持する日数。有効な値は、0~365です。デフォルトは14日です。 保持期間が過ぎると、データはパージされ、その後の再起動では使用できなくなります。 |
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
ロードタイプ | すべて | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
スキーマ | すべて | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 接続プロパティで指定されたスキーマ名がデフォルトで表示されます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
CDCスクリプト | 増分ロード、および初期ロードと増分ロードの組み合わせCDCテーブルまたはログベースのメソッドを使用する | ソーステーブルでCDCを有効にするためのスクリプトを生成し、スクリプトを実行するか、ダウンロードします。次のオプションがあります。
SQL Serverソースの場合は、このオプションを使用する必要があります。 注: 一意のインデックスを持つテーブルを含め、プライマリキーのないソーステーブルの場合、選択されているオプションに関係なく、デフォルトですべてのカラムのCDCが有効になっています。 Microsoft SQL Serverソースの場合、スクリプトはストアドプロシージャsys.sp_cdc_enable_dbおよびsys.sp_cdc_enable_tableを実行して、ソースデータベースおよびテーブルでCDCを有効にします。RDS for SQL Serverの場合、スクリプトはmsdb.dbo.rds_cdc_enable_dbプロシージャを実行してソースデータベースでCDCを有効にし、sys.sp_cdc_enable_tableスクリプトを実行してテーブルのCDCを追跡します。 必要な権限がある場合は、[実行]をクリックしてスクリプトを実行します。または、[ダウンロード]アイコンをクリックしてスクリプトをダウンロードし、DBAに渡して実行できるようにします。 注: このフィールドは、クエリベースのCDCメソッドを選択した場合は表示されません。 |
ファイルグループのキャプチャ | 増分ロード、および初期ロードと増分ロードの組み合わせ | キャプチャ用に作成される変更テーブルに使用するファイルグループの名前。このフィールドを空のままにすると、変更テーブルはデータベースのデフォルトのファイルグループに配置されます。 |
ゲートロール | 増分ロード、および初期ロードと増分ロードの組み合わせ | データを変更するためのアクセスをゲートするために使用されるデータベースロールの名前。このフィールドを空のままにすると、データベースはゲートロールを使用しません。 |
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
LOBを含める | Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen 2、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、Snowflake、またはSQL Serverターゲットへの初期ロード。 Kafka対応Azure Event Hubs、Databricks、Microsoft Fabric OneLake、PostgreSQL、Snowflake、およびSQL Serverターゲットへの増分ロード。[クエリベース]のCDCメソッドを選択した場合は無効になります。 Databricks、Microsoft Fabric OneLake、PostgreSQL、Snowflake、およびSQL Serverターゲットへの初期ロードと増分ロードの組み合わせ。[クエリベース]のCDCメソッドを選択した場合は無効になります。 | ターゲットにデータをレプリケートするラージオブジェクト(LOB)カラムがソースに含まれている場合は、このチェックボックスを選択します。 SQL ServerソースのLOBデータ型: GEOGRAPHY、GEOMETRY、IMAGE、NTEXT、NVARCHAR(MAX)、TEXT、VARBINARY(MAX)、VARCHAR(MAX)、およびXML LOBデータは、ターゲットで切り詰められる可能性があります。詳細については、「LOBの切り詰めについて」を参照してください。 |
永続ストレージの有効化 | 増分ロード、および初期ロードと増分ロードの組み合わせ。 注: このプロパティは、サーバーレスランタイム環境を使用している場合は使用できません。 クエリベースのCDCメソッドを使用するSQL Serverソースの場合、このフィールドは表示されません。これは、永続ストレージがデフォルトで有効になっていて変更できないためです。 | ターゲットへのデータの書き込みが遅い場合や遅延している場合でもデータを継続的に使用できるようにディスクバッファへのトランザクションデータの永続ストレージを有効にするには、このチェックボックスを選択します。 永続ストレージを使用する利点は、ソーストランザクションログの消費が高速になり、ログアーカイブやバックアップへの依存度が低くなるため、データベース取り込みジョブを再開した後もディスクストレージ内の永続データに引き続きアクセスできることです。 保持されたデータは、Secure Agentに保存されます。データは暗号化されていません。Secure Agentのファイルとディレクトリは、ネイティブファイルシステムへのアクセス権限またはファイルシステムのネイティブ暗号化サポートを使用して、不要なアクセスから保護されることが期待されます。 このチェックボックスをオンにして[CDCデータのステージング]も選択すると、このチェックボックスはオフになり、使用できなくなります。 |
増分ロード操作の当初の開始点 | 増分ロードのみ | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
[メソッド]が[クエリベースのCDC]に設定されている場合、このオプションは使用できません。 [CDCデータのステージング]オプションを選択した場合、このオプションは使用できません。 [CDCデータのステージング]オプションを選択した場合、このオプションは使用できません。 デフォルトは[使用可能な最新]です。 注:
|
CDCデータのステージング | 増分ロード、および初期ロードと増分ロードの組み合わせ | ソースデータベースから単一パスでデータを読み取り、そのデータを共通ストレージに書き込んで、同じデータベースを処理する複数のタスクでデータを読み取れるようにする場合は、このチェックボックスをオンにします。ステージングされたデータは、ステージンググループ内のタスクが読み取ることができます。ログベースのソースの場合、タスクは異なるスキーマを持つ異なるテーブルを処理することができます。 |
ステージンググループ | 増分ロード、および初期ロードと増分ロードの組み合わせ | CDCステージンググループを使用して複数のタスクのCDCデータをステージングする場合は、以前に定義したグループをリストから選択するか、[新規]をクリックしてグループを作成します。 |
プロパティ | 説明 |
|---|---|
グループ名 | 生成されたグループ名(Log_group_cdc_yyyymmdd<number>形式)をそのまま使用するか、カスタム名を入力します。 |
場所 | ステージンググループ定義を格納するプロジェクト(デフォルトの場所を使用しない場合)。 |
ステージングの場所の接続 | クラウドのステージング場所(Amazon S3、Google Cloud Storage、またはMicrosoft Azure Data Lake Storage Gen2)への接続を選択します。 |
ランタイム環境 | CDCステージングタスクの実行に使用するランタイム環境を選択します。 ログベースのソースの場合は、タスクが実行されるSecure Agentがすべてのソースログにアクセスできることを確認します。 |
ログを読み取るための代替接続の有効化 | [ソース]ページで選択した接続以外のソース接続を使用して、ソースログからデータの読み取りを行う場合は、このチェックボックスをオンにします。例えば、初期ロードとCDCを実行する場合は、CDCに必要な追加の権限を持つ接続を選択することができます。 |
ログを読み取るための代替接続 | ログを読み取るための代替接続を選択します。 |
CDCメソッド | ステージンググループ内のタスクでは、SQL Serverソースに対して[CDCテーブル]メソッドまたは[ログベース]メソッドのいずれかを使用できます。[クエリベース]メソッドを使用するこはできません。 ソースプロパティで以前にCDCメソッドを設定した場合は、このフィールドを使用してCDCステージングジョブでオーバーライドすることができます。 |
LOBを含める | ステージンググループ内のすべてのCDCタスクで、ソースデータベース内のテーブルのLOBデータをキャプチャしてステージングする場合は、このチェックボックスをオンにします。 注: 以前に[詳細ソースプロパティ]でこのオプションを選択した場合は、初期ロードジョブでLOBデータの読み取りも実行されます。 CDCステージングタスクの実行後にLOBデータキャプチャを有効にする場合は、タスクを再デプロイするか、このオプションを有効にして別のステージンググループを作成します。 |
行フラッシュしきい値 | データがクラウドストレージに転送される前に、データを一時的に保存するファイルに書き込むことができる最大行数。この行数に到達したとき、またはフラッシュ間隔が経過すると、データがクラウドストレージにフラッシュされます。 デフォルトは50000行です。 |
フラッシュ間隔 | ソースでの変更アクティビティが少ない期間中、ジョブが一時ファイル内のデータをクラウドストレージにフラッシュする前に、より多くの変更データを待機する分数と秒数。この間隔が経過するか、行フラッシュしきい値に到達したときにデータがフラッシュされます。 デフォルトは30秒です。 |
ログの開始点 | CDCステージングジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置。次のオプションがあります。
注: これらのオプションは、ソースプロパティの[増分ロードの初期開始点]で説明されているオプションと似ています。 デフォルトは[使用可能な最新]です。 |
ステージングデータ保持期間 | クラウドストレージにデータを保持する日数。有効な値は、0~365です。デフォルトは14日です。 保持期間が過ぎると、データはパージされ、その後の再起動では使用できなくなります。 |
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードJDBCパーティション化方法 | 初期ロード処理または組み合わせロードジョブのアンロードフェーズのために、ソーステーブル行をパーティション化する際に使用する方法。 有効な値は以下のとおりです。
例えば、26個のパーティションが要求されていて、低値のプライマリキーがAで始まり、高値のプライマリキーがZで始まる場合、AからZまでのプライマリキーを持つ行のセットごとに1つのパーティションが想定されます。ただし、プライマリキーの90%がQ、R、またはSで始まる場合、行の90%は3つのパーティションにのみ割り当てられます。 デフォルト値は[均一]です。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション化方法が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソース最大並列パーティション | 初期ロード処理中または組み合わせジョブのアンロードフェーズ中に、並列でソースにクエリするために使用できるパーティションリーダースレッドの最大数。 このプロパティを使用して、ソースに対して同時に実行できるソースパーティションクエリの数を制御します。例えば、テーブルに100個のパーティションのデータが含まれている場合、デフォルトでは100個のパーティションすべてに対して同時にクエリされます。ただし、このプロパティを使用して、同時クエリの数を減らすことができます。 デフォルト値は、パーティションの総数と同じです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション読み取りスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ロードタイプ | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
データベース | ソースコレクションを含むソースデータベース。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なデータベースのみが含まれます。 データベースを指定すると、[ソースコレクション]セクションが表示され、データベース内のコレクションが一覧表示されます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
ルールタイプ別のコレクションのリスト | すべて | コレクションの選択条件に一致するソースコレクションのリストを生成してダウンロードします。 ルールベースのコレクション選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
[ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
取得サイズ | すべて | データベース取り込みとレプリケーションジョブがMongoDBソースから一度に読み取る必要があるレコードの数。有効な値は1~2147483647です。デフォルトは5000。 |
増分ロード操作の当初の開始点 | 増分ロードのみ | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
デフォルトは[使用可能な最新]です。 注:
|
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ロードタイプ | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
スキーマ | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
LOBを含める | すべて | ターゲットにデータをレプリケートする元となるラージオブジェクト(LOB)データ型のカラムがソースに含まれている場合は、このチェックボックスを選択します。 MySQLソースのLOBデータ型は、BLOB、LONGBLOB、MEDIUMBLOB、TINYBLOB、JSON、TEXT、LONGTEXT、MEDIUMTEXT、TINYTEXTです。 LOBデータは、ターゲットで切り詰められる可能性があります。詳細については、「LOBの切り詰めについて」を参照してください。 このオプションを選択しておらず、ソースにLOBカラムが含まれている場合、ターゲットでは対応するLOBカラムは作成されますが、それらのカラムにはNULLがレプリケートされます。 |
永続ストレージの有効化 | 増分ロード、および初期ロードと増分ロードの組み合わせ 注: このプロパティは、サーバーレスランタイム環境を使用している場合は使用できません。 | ターゲットへのデータの書き込みが遅い場合や遅延している場合でもデータを継続的に使用できるようにディスクバッファへのトランザクションデータの永続ストレージを有効にするには、このチェックボックスを選択します。 永続ストレージを使用する利点は、ソーストランザクションログの消費が高速になり、ログアーカイブやバックアップへの依存度が低くなるため、データベース取り込みジョブを再開した後もディスクストレージ内の永続データに引き続きアクセスできることです。 保持されたデータは、Secure Agentに保存されます。データは暗号化されていません。Secure Agentのファイルとディレクトリは、ネイティブファイルシステムへのアクセス権限またはファイルシステムのネイティブ暗号化サポートを使用して、不要なアクセスから保護されることが期待されます。 |
増分ロード操作の当初の開始点 | 増分ロードのみ | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
デフォルトは[使用可能な最新]です。 注:
|
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ロードタイプ | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。利用可能な唯一のオプションは次のとおりです。
|
スキーマ | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
プロパティ | 説明 |
|---|---|
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。このプロパティを選択すると、複数のパーティションを使用し、パーティションごとに1つのクエリが使用されます。 デフォルトでは、このプロパティは選択されていません。 |
アンロードソースパーティション数 | [パーティション化の有効化]カスタムプロパティが選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
ロードタイプ | すべて | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
スキーマ | すべて | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
CDCスクリプト | 増分ロード、および初期ロードと増分ロードの組み合わせログベースのメソッドを使用する | ソーステーブルでCDCを有効にするためのスクリプトを生成し、スクリプトを実行するか、ダウンロードします。次のオプションがあります。
注: 一意のインデックスを持つテーブルを含め、プライマリキーのないソーステーブルの場合、選択されているオプションに関係なく、デフォルトですべてのカラムのCDCが有効になっています。 Google BigQueryターゲットを対象とするタスクには使用しないようにしてください。 Oracleソースの場合、スクリプトは、選択したソーステーブルのすべてまたはプライマリキーカラムの補足ログを有効にして、REDOログに追加情報を記録します。 必要な権限がある場合は、[実行]をクリックしてスクリプトを実行します。または、[ダウンロード]アイコンをクリックしてスクリプトをダウンロードし、DBAに渡して実行できるようにします。 注: このフィールドは、クエリベースのCDCメソッドを選択した場合は表示されません。 |
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
フラッシュバックの無効化 | 初期ロード | データベースからデータを取得するときにデータベース取り込みとレプリケーションがOracle Flashbackを使用できないようにするには、このチェックボックスを選択します。 このチェックボックスは、新しい初期ロードタスクに対してデフォルトで選択されています。既存の初期ロードタスクの場合、このチェックボックスはデフォルトでクリアされているため、Oracle Flashbackは有効のままになります。パーティション化が有効なタスクの場合、このチェックボックスは自動的に選択され、編集できません。 |
LOBを含める | Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen 2、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、Snowflake、またはSQL Serverターゲットへのすべてのロードタイプ。 増分ロードおよび組み合わせロードでは、[ログベース]または[クエリベース]のCDCメソッドのいずれかを使用できます。ただし、[ログベース]のCDCメソッドを使用するジョブは、LONG、LONG RAW、およびXMLカラムのデータを、生成されたターゲットカラムにレプリケートしません。 | ターゲットにデータをレプリケートするラージオブジェクト(LOB)カラムがソースに含まれている場合は、このチェックボックスを選択します。 OracleソースのLOBデータ型: BLOB、CLOB、NCLOB、LONG、LONG RAW、およびXML LOBデータは、ターゲットで切り詰められる可能性があります。詳細については、「LOBの切り詰めについて」を参照してください。 |
永続ストレージの有効化 | 増分ロード、および初期ロードと増分ロードの組み合わせ。 注: このプロパティは、サーバーレスランタイム環境を使用している場合は使用できません。 クエリベースのCDCメソッドを使用するソースの場合、このフィールドは表示されません。これは、永続ストレージがデフォルトで有効になっていて変更できないためです。 | ターゲットへのデータの書き込みが遅い場合や遅延している場合でもデータを継続的に使用できるようにディスクバッファへのトランザクションデータの永続ストレージを有効にするには、このチェックボックスを選択します。 永続ストレージを使用する利点は、ソーストランザクションログの消費が高速になり、ログアーカイブやバックアップへの依存度が低くなるため、データベース取り込みジョブを再開した後もディスクストレージ内の永続データに引き続きアクセスできることです。 保持されたデータは、Secure Agentに保存されます。データは暗号化されていません。Secure Agentのファイルとディレクトリは、ネイティブファイルシステムへのアクセス権限またはファイルシステムのネイティブ暗号化サポートを使用して、不要なアクセスから保護されることが期待されます。 このチェックボックスをオンにして[CDCデータのステージング]も選択すると、このチェックボックスはオフになり、使用できなくなります。 |
増分ロード操作の当初の開始点 | 増分ロードのみ | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
[メソッド]が[クエリベースのCDC]に設定されている場合、このオプションは使用できません。 [CDCデータのステージング]オプションを選択した場合、このオプションは使用できません。 [CDCデータのステージング]オプションを選択した場合、このオプションは使用できません。 デフォルトは[使用可能な最新]です。 注:
|
CDCデータのステージング | 増分ロード、および初期ロードと増分ロードの組み合わせ | ソースデータベースから単一パスでデータを読み取り、そのデータを共通ストレージに書き込んで、同じデータベースを処理する複数のタスクでデータを読み取れるようにする場合は、このチェックボックスをオンにします。ステージングされたデータは、ステージンググループ内のタスクが読み取ることができます。ログベースのソースの場合、タスクは異なるスキーマを持つ異なるテーブルを処理することができます。 |
ステージンググループ | 増分ロード、および初期ロードと増分ロードの組み合わせ | CDCステージンググループを使用して複数のタスクのCDCデータをステージングする場合は、以前に定義したグループをリストから選択するか、[新規]をクリックしてグループを作成します。 |
プロパティ | 説明 |
|---|---|
グループ名 | 生成されたグループ名(Log_group_cdc_yyyymmdd<number>形式)をそのまま使用するか、カスタム名を入力します。 |
場所 | ステージンググループ定義を格納するプロジェクト(デフォルトの場所を使用しない場合)。 |
ステージングの場所の接続 | クラウドのステージング場所(Amazon S3、Google Cloud Storage、またはMicrosoft Azure Data Lake Storage Gen2)への接続を選択します。 |
ランタイム環境 | CDCステージングタスクの実行に使用するランタイム環境を選択します。 ログベースのソースの場合は、タスクが実行されるSecure Agentがすべてのソースログにアクセスできることを確認します。 |
ログを読み取るための代替接続の有効化 | [ソース]ページで選択した接続以外のソース接続を使用して、ソースログからデータの読み取りを行う場合は、このチェックボックスをオンにします。例えば、初期ロードとCDCを実行する場合は、CDCに必要な追加の権限を持つ接続を選択することができます。 |
ログを読み取るための代替接続 | ログを読み取るための代替接続を選択します。 |
CDCメソッド | 唯一のオプションは[ログベース]です。 |
LOBを含める | ステージンググループ内のすべてのCDCタスクで、ソースデータベース内のテーブルのLOBデータをキャプチャしてステージングする場合は、このチェックボックスをオンにします。 注: 以前に[詳細ソースプロパティ]でこのオプションを選択した場合は、初期ロードジョブでLOBデータの読み取りも実行されます。 CDCステージングタスクの実行後にLOBデータキャプチャを有効にする場合は、タスクを再デプロイするか、このオプションを有効にして別のステージンググループを作成します。 |
行フラッシュしきい値 | データがクラウドストレージに転送される前に、データを一時的に保存するファイルに書き込むことができる最大行数。この行数に到達したとき、またはフラッシュ間隔が経過すると、データがクラウドストレージにフラッシュされます。 デフォルトは50000行です。 |
フラッシュ間隔 | ソースでの変更アクティビティが少ない期間中、ジョブが一時ファイル内のデータをクラウドストレージにフラッシュする前に、より多くの変更データを待機する分数と秒数。この間隔が経過するか、行フラッシュしきい値に到達したときにデータがフラッシュされます。 デフォルトは30秒です。 |
ログの開始点 | CDCステージングジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置。次のオプションがあります。
注: これらのオプションは、ソースプロパティの[増分ロードの初期開始点]で説明されているオプションと似ています。 デフォルトは[使用可能な最新]です。 |
ステージングデータ保持期間 | クラウドストレージにデータを保持する日数。有効な値は、0~365です。デフォルトは14日です。 保持期間が過ぎると、データはパージされ、その後の再起動では使用できなくなります。 |
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードJDBCパーティション化方法 | 初期ロード処理または組み合わせロードジョブのアンロードフェーズのために、ソーステーブル行をパーティション化する際に使用する方法。 有効な値は以下のとおりです。
例えば、26個のパーティションが要求されていて、低値のプライマリキーがAで始まり、高値のプライマリキーがZで始まる場合、AからZまでのプライマリキーを持つ行のセットごとに1つのパーティションが想定されます。ただし、プライマリキーの90%がQ、R、またはSで始まる場合、行の90%は3つのパーティションにのみ割り当てられます。 デフォルト値は[均一]です。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション化方法が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソース最大並列パーティション | 初期ロード処理中または組み合わせジョブのアンロードフェーズ中に、並列でソースにクエリするために使用できるパーティションリーダースレッドの最大数。 このプロパティを使用して、ソースに対して同時に実行できるソースパーティションクエリの数を制御します。例えば、テーブルに100個のパーティションのデータが含まれている場合、デフォルトでは100個のパーティションすべてに対して同時にクエリされます。ただし、このプロパティを使用して、同時クエリの数を減らすことができます。 デフォルト値は、パーティションの総数と同じです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション読み取りスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
ロードタイプ | すべて | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
スキーマ | すべて | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
レプリケーションスロット名 | 増分ロード、および初期ロードと増分ロードの組み合わせ | PostgreSQLレプリケーションスロットの一意の名前。 スロット名には、小文字のラテン英数字とアンダースコア(_)文字を含めることができます。最大長は63文字です。 重要: 各データベース取り込みとレプリケーションタスクは、異なるレプリケーションスロットを使用する必要があります。 |
レプリケーションプラグイン | 増分ロード、および初期ロードと増分ロードの組み合わせ | PostgreSQLレプリケーションプラグイン。次のオプションがあります。
|
パブリケーション | 増分ロード、および初期ロードと増分ロードの組み合わせ | レプリケーションプラグインとしてpgoutputを選択した場合は、このプラグインが使用するパブリケーション名を指定します。 注: レプリケーションプラグインとしてwal2jsonを選択した場合、このフィールドは表示されません。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
CDCスクリプト | 増分ロード、および初期ロードと増分ロードの組み合わせ | ソーステーブルでCDCを有効にするためのスクリプトを生成し、スクリプトを実行するか、ダウンロードします。使用可能なオプションは、[すべてのカラムのCDCを有効化]のみです。 PostgreSQLソースの場合、スクリプトは選択されたソーステーブルにREPLICATION IDENTITY FULLを設定して、すべてのカラム値をWALファイルに書き込みます。また、pgoutputまたはwal2jsonタイプのレプリケーションスロットを作成します。スロットタイプがpgoutputの場合、スクリプトはパブリケーションも作成し、そこにテーブルを追加します。 必要な権限がある場合は、[実行]をクリックしてスクリプトを実行します。または、[ダウンロード]アイコンをクリックしてスクリプトをダウンロードし、DBAに渡して実行できるようにします。 |
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
LOBを含める | Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen 2、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、Snowflake、またはSQL Serverターゲットへの初期ロード。 Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Kafka対応Azure Event Hubs、Microsoft Azure Data Lake Storage Gen 2、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、Snowflake、またはSQL Serverターゲットへの増分ロード。 Amazon Redshift、Amazon S3、Databricks、Google BigQuery、Google Cloud Storage、Microsoft Azure Data Lake Storage Gen 2、Microsoft Azure Synapse Analytics、Microsoft Fabric OneLake、Oracle、Oracle Cloud Object Storage、PostgreSQL、Snowflake、またはSQL Serverターゲットへの初期ロードと増分ロードの組み合わせ。 | ターゲットにデータをレプリケートするラージオブジェクト(LOB)カラムがソースに含まれている場合は、このチェックボックスを選択します。 PostgreSQLソースのLOBデータ型: BYTEA、TEXT、およびXMLに加えて、JSON、JSONBなど大きくなる可能性があるその他の型 LOBデータは、ターゲットで切り詰められる可能性があります。詳細については、「LOBの切り詰めについて」を参照してください。 |
増分ロード操作の当初の開始点 | 増分ロードのみ | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
[CDCデータのステージング]を選択した場合、SAP HANAソースがあってログベースのCDCメソッドを使用するときを除き、このオプションは使用できません。 デフォルトは[使用可能な最新]です。 注:
|
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
ロードタイプ | すべて | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。次のオプションがあります。
注: 初期アンロードロードフェーズ中に変更レコードがキャプチャされた場合、その変更レコードはアンロードフェーズが完了するまで適用処理の対象から外されます。アンロードフェーズ中にキャプチャされた挿入行は、削除操作と挿入操作のペアに変換され、アンロードされたデータとキャプチャされた変更データの両方で挿入が発生した場合は、1つの挿入行のみがターゲットに適用されるようになります。 |
スキーマ | すべて | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 接続プロパティで指定されたスキーマ名がデフォルトで表示されます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
CDCメソッド | 増分ロード、および初期ロードと増分ロードの組み合わせ | 読み取り専用モードで[ログベース]または[トリガベース]のいずれかを表示します。このCDCメソッドは、使用中のSAP HANA Database Ingestion接続で設定したキャプチャタイプから派生しています。 |
CDCスクリプト | 増分ロード、および初期ロードと増分ロードの組み合わせ | ソーステーブルでCDCを有効にするためのスクリプトを生成し、スクリプトを実行するか、ダウンロードします。使用可能なオプションは、[すべてのカラムのCDCを有効化]のみです。 トリガベースのCDCを使用するSAP HANAおよびSAP HANA Cloudソースの場合、スクリプトは必要なPKLOG、PROCESSED、および_CDCシャドーテーブルを作成します。また、選択されたソーステーブルごとに3つのトリガと1つのシーケンスを作成します。 ログベースのCDCを使用するSAP HANAソースの場合、CDCステージングタスクによってキャプチャされた変更データをステージングするデータベースキャッシュにTRANSACTIONSテーブルとROWCACHEテーブルを作成します。 必要な権限がある場合は、[実行]をクリックしてスクリプトを実行します。または、[ダウンロード]アイコンをクリックしてスクリプトをダウンロードし、DBAに渡して実行できるようにします。 |
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
LOBを含める | 増分ロード、および初期ロードと増分ロードの組み合わせ | 使用不可。 |
永続ストレージの有効化 | 増分ロード、および初期ロードと増分ロードの組み合わせ 注: このプロパティは、サーバーレスランタイム環境を使用している場合は使用できません。 | ログベースのCDCメソッドを使用するソースでは、ターゲットへのデータの書き込みが遅い場合や遅延している場合でもデータを継続的に使用できるようにディスクバッファでトランザクションデータの永続ストレージを有効にするために、このチェックボックスを選択します。 トリガーベースのCDCメソッドを使用するソースでは、このオプションはデフォルトで選択されており、変更できません。 永続ストレージを使用する利点は、ソーストランザクションログの消費が高速になり、ログアーカイブやバックアップへの依存度が低くなるため、データベース取り込みジョブを再開した後もディスクストレージ内の永続データに引き続きアクセスできることです。 保持されたデータは、Secure Agentに保存されます。データは暗号化されていません。Secure Agentのファイルとディレクトリは、ネイティブファイルシステムへのアクセス権限またはファイルシステムのネイティブ暗号化サポートを使用して、不要なアクセスから保護されることが期待されます。 |
増分ロード操作の当初の開始点 | 増分ロード(ログベースおよびトリガベースのCDC) | データベース取り込みとレプリケーションジョブが初めて実行されたときに変更レコードの読み取りを開始するソースログ内の位置をカスタマイズする場合は、次のいずれかのオプションを選択します。
トリガーベースのCDCの場合、PKLOGテーブルで利用可能な最も早いレコード。 ログベースのCDCの場合、TRANSACTIONSテーブルの最も早いポイント。 値が無効な場合、ジョブは失敗します。デフォルトでは0というデフォルト値が表示され、これが使用可能な最も早いポイントになります。 トリガーベースのCDCでは、日付と時刻のタイムゾーンはSAP HANAデータベースのタイムゾーンと同じになります。 ログベースのCDCの場合は、この値をUTCで入力してください。ログベースのCDCメソッドは、すべてのタイムスタンプをUTCで保存します。 デフォルトは[使用可能な最新]です。 注:
|
CDCデータのステージング | 増分ロード、および初期ロードと増分ロードの組み合わせログベースのCDCメソッドを使用する | このオプションはログベースのCDCタスクではデフォルトで選択されており、選択解除することはできません。このオプションにより、ジョブはソースデータベースから単一パスでデータを読み取り、そのデータを共通ストレージに書き込むことができます。データはステージンググループ内の複数のタスクでストレージから読み取ることができます。タスクでは同じデータベースを処理する必要がありますが、別のスキーマを持つ異なるテーブルを処理できます。 |
ステージンググループ | 増分ロード、および初期ロードと増分ロードの組み合わせログベースのCDCメソッドを使用する | 複数のログベースのCDCタスク用にCDCデータをステージングするためのCDCステージンググループを指定するには、以前に定義したグループをリストから選択するか、[新規]をクリックして新しいグループを作成します。ただし、新規作成するのは、使用している接続がすでにステージンググループにまだ関連付けられていない場合に限ります。 同じ接続を使用する別のログベースのCDCタスクが、デプロイ済みのステージンググループにすでに関連付けられている場合、このフィールドにはそのグループ名が読み取り専用モードで表示され、[新規]ボタンは無効になります。グループのカスタムプロパティを追加する必要がある場合は、グループプロパティを編集できます。他のグループプロパティは接続によって提供され、編集できません。 ソース接続がデプロイ済みのCDCステージングタスクにまだ関連付けられていない場合は、新しいグループを作成する必要があります。 |
プロパティ | 説明 |
|---|---|
グループ名 | 生成されたグループ名(Log_group_cdc_yyyymmdd<number>形式)をそのまま使用するか、カスタム名を入力します。 |
場所 | ステージンググループ定義を格納するプロジェクト(デフォルトの場所を使用しない場合)。 |
ランタイム環境 | CDCステージングタスクの実行に使用するランタイム環境を選択します。 ログベースのソースの場合は、タスクが実行されるSecure Agentがすべてのソースログにアクセスできることを確認します。 |
ステージングデータ保持期間 | クラウドストレージにデータを保持する日数。 SAP HANA(ログベース)ソースの場合、このフィールドは読み取り専用です。SAP HANA Database Ingestion接続の[ログのクリア]プロパティに設定された日数が表示されます。この期間が経過すると、キャッシュデータベースにステージングされたデータが圧縮されます。 |
プロパティ | 説明 |
|---|---|
読み取りイベントバッチサイズ | CDC処理中に内部イベントキューにバッチで書き込まれるペイロードイベントの数。 イベントキューが内部リングバッファとして実装されている場合、この値は、リーダーが1つの内部バッファスロットに書き込むペイロードイベントの数です。 注: バッチサイズが小さすぎると、スレッド間の競合が増加する可能性があります。バッチサイズが大きくなると、並列処理が増える一方、メモリ消費量も増えます。 |
リーダーディストリビュータ数 | 変更データをターゲットに渡すことができる正規の形式に変換するために、CDC処理中に使用されるリーダーヘルパスレッドの数。 デフォルト値は3です。より大きな値を入力すると、変換処理を並列で実行するためにより多くのスレッドを使用できるようになります。 |
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードJDBCパーティション化方法 | 初期ロード処理または組み合わせロードジョブのアンロードフェーズのために、ソーステーブル行をパーティション化する際に使用する方法。 有効な値は以下のとおりです。
例えば、26個のパーティションが要求されていて、低値のプライマリキーがAで始まり、高値のプライマリキーがZで始まる場合、AからZまでのプライマリキーを持つ行のセットごとに1つのパーティションが想定されます。ただし、プライマリキーの90%がQ、R、またはSで始まる場合、行の90%は3つのパーティションにのみ割り当てられます。 デフォルト値は[均一]です。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション化方法が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソース最大並列パーティション | 初期ロード処理中または組み合わせジョブのアンロードフェーズ中に、並列でソースにクエリするために使用できるパーティションリーダースレッドの最大数。 このプロパティを使用して、ソースに対して同時に実行できるソースパーティションクエリの数を制御します。例えば、テーブルに100個のパーティションのデータが含まれている場合、デフォルトでは100個のパーティションすべてに対して同時にクエリされます。ただし、このプロパティを使用して、同時クエリの数を減らすことができます。 デフォルト値は、パーティションの総数と同じです。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション読み取りスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |
プロパティ | 説明 |
|---|---|
ロードタイプ | データベース取り込みとレプリケーションタスクを実行するロード操作のタイプ。利用可能な唯一のオプションは次のとおりです。
|
スキーマ | ソーステーブルを含むソーススキーマ。 リストには、指定されたソース接続でアクセスされるデータベースで使用可能なスキーマのみが含まれます。 スキーマを指定すると、[ソーステーブル]セクションが表示され、スキーマ内のテーブルが一覧表示されます。 |
プロパティ | ロードタイプ | 説明 |
|---|---|---|
ルールタイプ別のテーブルのリスト | すべて | テーブルの選択条件に一致するソーステーブルのリストを生成してダウンロードします。 ルールベースのテーブル選択を使用した場合は、使用する選択ルールのタイプを選択することができます。次のオプションがあります。
使用したテーブルの選択方法に関係なく、リストにカラムを含めるには、[カラムを含める]チェックボックスをオンにします。 [ダウンロード]アイコンをクリックすると、リストがダウンロードされます。 |
プロパティ | 説明 |
|---|---|
アンロードヘルパスレッド数 | アンロードされたデータ行をライターに渡すことができる正規の形式に変換するために、初期ロードジョブまたは組み合わせジョブのアンロードフェーズに割り当てられたアンロードヘルパスレッドの数。 デフォルト値は2です。2つのスレッドが受信ボリュームに追いつかない場合は、スレッド数を増やすことができます。並列SQL結果セットが開いている(通常はソースパーティション化が有効な場合に発生する)場合、または一部の行が非常に大きいか幅が広いため変換時間が長くなる場合は、スレッド数を増やすことを検討してください。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なスレッド数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
パーティション化の有効化 | 初期ロード処理中または組み合わせロードジョブのアンロードフェーズ中に、アンロードするソースデータを並列でクエリするために複数のパーティションを使用するかどうかを制御します。複数のパーティションでそれぞれのパーティションに1つのクエリを割り当てる場合に、このプロパティを選択します。 デフォルトでは、このプロパティは選択されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによってパーティション化を有効にするかどうかが決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
アンロードソースパーティション数 | カスタムプロパティ[パーティション化の有効化]が選択されている場合に、初期ロードジョブ中および組み合わせロードジョブのアンロードフェーズ中に、並列でソースデータをクエリするために使用するパーティションの数。 デフォルト値は指定されていません。 注: ウィザードの最後のページで[自動チューニング]オプションを選択すると、自動チューニングによって最適なパーティション数が決定されます。このカスタムプロパティを設定することで自動チューニングの値を上書きすることができます。 |
カスタム | プロパティの名前とその値を手動で入力するには、このオプションを選択します。このオプションを使用して、Informaticaグローバルカスタマサポートまたは技術スタッフメンバーから特殊なケースのために指定されたプロパティを入力します。サポートされているすべてのロードタイプで使用できます。 |