未割り当てデータ
インテリジェント構造検出は、ファイルの構造を検出するときに、ファイルにインテリジェント構造モデルと一致しないレコードがある場合、[未割り当てデータ]というフィールドを作成することがあります。
インテリジェント構造検出は、以下のシナリオを含むさまざまな理由で[未割り当てデータ]フィールドを作成します。
- •CSVファイルやログファイルなどの区切りファイルには、想定以上に多くの要素が含まれており、インテリジェント構造検出はデータドリフトを解析できません。
- •JSONファイル内のレコードがインテリジェント構造モデルに含まれていないか、最大レコードサイズを超えています。
最大レコードサイズ
インテリジェント構造検出は、JSONサンプルファイルの構造を検出するときに、最大レコードサイズを使用して繰り返しレコードを識別します。レコードが最大レコードサイズより大きい場合、インテリジェント構造検出はそのレコードを[未割り当てデータ]フィールドに割り当てます。
デフォルトの最大レコードサイズは640,000バイトです。最大レコードサイズを大きくして、[未割り当てデータ]フィールドを使用しないようにすることができます。
最大レコードサイズを編集するには、Administratorを使用して、データ統合サーバープロパティのJVMオプションを設定します。次の構文を使用して、最大レコードサイズを定義します。
-DISD_MAX_RECORD_SIZE=<size in bytes>
例えば、2 MBの最大レコードサイズを定義するには、JVMOption1プロパティに次の値を入力します。
-DISD_MAX_RECORD_SIZE=2000000
注: 最大レコードサイズを大きくすると検出プロセスのメモリ消費量が増えることに注意してください。このため、必要に応じて次のアクションのいずれかまたは両方を実行する必要があります。
- •データ統合サーバープロパティの最大JVMヒープサイズを増やします。JVMヒープサイズを増やすには、JVMプロパティの1つを-Xmx<heap size in megabytes>に設定します。
- •Secure Agentマシンのメモリを増やします。Secure AgentがInformatica Cloudホステッドエージェントで実行されている場合は、Informaticaグローバルカスタマサポートにお問い合わせください。
データ統合サーバープロパティとSecure Agentの設定の詳細については、Administratorヘルプを参照してください。