構造パーサートランスフォーメーションのルールおよびガイドライン
構造パーサートランスフォーメーションを使用する場合は、次のルールおよびガイドラインを考慮してください。
- •Mapping Designerで構造パーサートランスフォーメーションを含むマッピングを開き、トランスフォーメーションに関連付けられているインテリジェント構造モデルを変更した場合、Mapping Designerにメッセージが表示されます。メッセージ内に提示されるリンクをクリックして、マッピングに適合するようにモデルを更新します。
- •すべての出力フィールドに文字列データ型が割り当てられていた古いバージョンのインテリジェント構造検出で作成されたインテリジェント構造モデルを更新すると、更新中に構造パーサートランスフォーメーションによってフィールドデータ型が変更される可能性があります。影響を受けるフィールドのいずれかにおいて、ダウンストリームトランスフォーメーションまたはターゲットに文字列が必要である場合は、データ型を文字列に戻すようにモデルを編集します。次に、Mapping Designerで提示されたリンクをクリックして、トランスフォーメーション内のモデルを再度更新します。
- •次の条件がすべて当てはまる場合、構造パーサートランスフォーメーションはXSD入力ファイル内の再帰的要素を解析できます。
- - 再帰的要素が繰り返し要素内にネストされていない。
- - 再帰的要素に常に同じ名前の要素が使用されている。
- - 構造パーサートランスフォーメーションが詳細モードのマッピングで使用されていない。
トランスフォーメーションで再帰的要素を解析できない場合は、単一の出力グループにデータが出力されます。このトランスフォーメーションでは、2023年10月リリース以降に作成されたマッピング、または2023年10月リリースにアップグレードした後にスキーマファイルを再アップロードした場合に、マッピング内の再帰的要素を解析できます。
- •マップレットで構造パーサートランスフォーメーションを使用する場合は、ランタイムエラーを防ぐために、組み合わせたマップレットトランスフォーメーション名が80文字を超えないようにしてください。詳細については、マップレットトランスフォーメーション名を参照してください。
詳細モードのマッピングに関するルールとガイドライン
詳細モードのマッピングで構造パーサートランスフォーメーションを使用する場合は、次のルールおよびガイドラインを考慮してください。
出力タイプのルールおよびガイドライン
構造パーサートランスフォーメーションの出力タイプを選択する場合は、次のルールおよびガイドラインを考慮してください。
- •Parquet出力タイプを使用するには、まずHADOOP_HOMEおよびhadoop.home.dir環境変数を設定します。
- •AVRO出力タイプを使用する場合、トランスフォーメーションでは同じ名前の入力フィールドの出力は生成されません。
- •トランスフォーメーションはORC出力をローカルの日時に基づいて作成します。同じ入力を異なる場所または環境で処理すると、時間および時間形式が異なる出力が生成される可能性があります。
- •大規模なXMLファイルやJSONファイルを作成するには、バイナリ出力タイプを使用することをお勧めします。