コンポーネント > インテリジェント構造モデル > インテリジェント構造モデルに対する入力
  

インテリジェント構造モデルに対する入力

実行時にモデルでの使用が想定される入力に基づいて、インテリジェント構造モデルの基礎となる入力は、サンプルファイル、XSDスキーマ、Avroスキーマ、またはCOBOLコピーブックを使用することができます。
入力ファイルのサイズは最大1 MBです。入力ファイルには、最大30,000個の単純なフィールドを含めることができます。ファイルに30,000を超える単純なフィールドが含まれる場合、インテリジェント構造検出は、グループとポートのないモデルを作成します。階層内のレベル数に制限はありません。
最適な解析結果を得るため、モデルの作成時に指定する入力は、実行時にモデルが受け取ると予想されるすべてのデータ要素を網羅するように幅広くしてください。入力の範囲が狭すぎる場合、解析の出力に識別できないデータが含まれます。入力に行が含まれる場合は、少なくとも3行のデータが含まれている必要があります。
簡易的な入力を使用してモデルを生成します。例えば、入力データにテーブルがある場合は、多数のデータ行ではなく、いくつかのサンプル行を含むテーブルを使用します。データの繰り返しグループを含むJSON入力ファイルを使用する場合は、繰り返しの回数を制限してください。
モデルが実行時の入力データと一致しない場合、または入力データと部分的にしか一致しない場合は、大量の未確認データが存在するかデータ損失が発生している可能性があります。ただし、一部のバリエーションは引き続き解析されます。
グループ名とフィールド名の各組み合わせの長さが255文字を超えていないことを確認してください。例えば、フィールドが属するグループの名前がgroupである場合、フィールド名に250文字を超える名前を使用することはできません。グループ名とフィールド名の組み合わせが255文字を超えていると、モデルを使用するマッピングの実行に失敗します。

XMLまたはJSONサンプルファイル全体からの構造の検出

デフォルトでは、インテリジェント構造検出は、サンプルファイルの最初の部分に基づいてデータの構造を検出します。XMLまたはJSONファイルに基づいてモデルを作成する場合、最大30 MBのファイル全体に基づいてデータの構造を検出するように選択できます。ファイルの最初の部分が、実行時にモデルを使用すると想定されるすべての入力を表していない場合は、このオプションを使用します。
インテリジェント構造検出がファイル全体に基づいてデータの構造を検出する場合、検出プロセスが完了するまでに数分かかる場合があります。

Microsoft Excelファイルからの構造の検出

次の種類のMicrosoft Excelファイルに基づいてモデルを作成できます: xla、xlam、xls、xlsm、xlsx、xlt、xltm、およびxltx。

ORCファイルの使用

モデルを使用して、データ統合のフラットファイル接続を介してORCファイルを読み取ることができます。このモデルをORCのストリーミングに使用することはできません。

モデルでの複数のサンプルファイルの使用

JSON、XML、ORC、AVRO、またはPARQUETサンプルファイルに基づいてモデルを作成した後に、追加のサンプルファイルを使用して、新しいサンプルに存在するフィールドで構造をエンリッチ化できます。追加のファイルは、モデルの基礎となるファイルのタイプと同一のファイルタイプである必要があります。

マルチファイルXSDスキーマの使用

モデル入力として複数のXSDファイルを含むXSDスキーマを使用する場合は、次のガイドラインを考慮してください。

大規模なXSDスキーマからの構造の検出

XSDスキーマに基づいてモデルを作成する場合、デフォルトでは、インテリジェント構造検出は最大1.5 MBのサイズのスキーマからデータの構造を検出できます。より大きなファイルを使用するには、次のいずれかのアクションを実行します。
これらのアクションのいずれかを実行せずに大規模なスキーマを使用すると、インテリジェント構造検出は入力をXMLとして扱い、部分的なデータに基づいて構造を検出します。

XSDベースのモデルでのXMLサンプルファイルの使用

構造パーサートランスフォーメーションで使用するXSDベースのモデルを作成する場合に、XMLサンプルファイルをモデルに添付できます。モデル内のグループの名前と内容は、インテリジェント構造モデルページに表示されます。モデルを構造パーサートランスフォーメーションに関連付ける場合は、この情報を使用して、ターゲットに接続するグループを指定します。サンプルファイルをモデルに添付した場合でも、モデルの構造に影響を及ぼしたり、モデルの構造が変更されたりすることはありません。

JSONでエンコードされたAvroメッセージの解析

Avroスキーマに基づくモデルを使用して、JSONでエンコードされたAvroメッセージを解析できます。

XSDスキーマの文字エンコード

モデル入力として使用するXSDスキーマでは、UTF-8またはUTF-16文字エンコードを使用できます。