トランスフォーメーション > ノーマライザトランスフォーメーション > 正規化されたフィールド
  

正規化されたフィールド

[正規化されたフィールド]タブで、正規化対象フィールドを定義します。マッピングに使用する他の受信フィールドも指定できます。
正規化されたフィールドを定義する際には、フィールドを手動で作成するか、受信フィールドのリストからフィールドを選択できます。正規化されたフィールドを作成する際には、データ型をStringまたはNumberに設定して、精度とスケールを指定できます。詳細モードでは、任意のプリミティブデータ型を使用できます。
詳細モードでは、ノーマライザトランスフォーメーションによって複数の出力グループが生成されます。それ以外の場合、ノーマライザトランスフォーメーションは1つの出力グループのみを生成します。
受信フィールドに複数回出現フィールドが含まれているが、対応するカテゴリフィールドがない場合は、カテゴリフィールドを作成してデータの出現回数を定義できます。例えば、3つの異なるタイプの所得を3つのフィールドで表すには、収入カテゴリフィールドを作成して出現回数値を3に設定します。

出現回数の設定

正規化されたフィールドの出現回数値を設定して、入力データに当該フィールドのインスタンスが出現する回数を定義します。
複数回出現フィールドを定義するには、フィールドの出現回数値を2以上の整数の値に設定します。出現回数値を2以上の値に設定すると、ノーマライザトランスフォーメーションによって、そのフィールドの生成カラムIDフィールドが作成されます。ノーマライザトランスフォーメーションは、すべての正規化対象データについて、生成キーフィールドも作成します。
また、ノーマライザトランスフォーメーションは、出現回数値を使用して、対応する出力フィールドのセットも作成します。出力フィールドは、ノーマライザトランスフォーメーションの[フィールドマッピング]タブに表示されます。出力フィールドの命名規則は、「<出現フィールド名>_<出現回数>」です。
1回出現フィールドを定義するには、当該フィールドの出現回数値を1に設定します。1回出現フィールドを定義することで、正規化されたフィールドリストに正規化する必要がない受信フィールドを含めることができます。

出現回数値の異なる複数回出現フィールドのグループ

ノーマライザトランスフォーメーションで、複数回出現フィールドの複数のグループを正規化できます。複数のグループを含める場合で、出現回数値が一致しない場合は、検証エラーが発生しないようにマッピングを設定します。
出現回数値の異なる複数回出現フィールドのグループを処理するには、次のいずれかの方法を使用します。
正規化されたデータを異なるターゲットに書き込む
正規化されたデータを異なるターゲットに書き込む場合は、出現回数値の異なる複数回出現フィールドを使用できます。
例えば、ソースデータに出現回数が4回の費用フィールドと出現回数が3回の収入フィールドが含まれているとします。このような場合は、正規化された費用データと正規化された収入データを、それぞれ別々のターゲットに書き込むようにマッピングを設定します。
異なる複数回出現フィールドに同じ出現回数を使用する
同じ出現回数を使用するように複数回出現フィールドを設定し、必要な生成フィールドを使用します。複数回出現フィールドに同じ出現回数を使用すると、正規化されたデータを同じターゲットに書き込むことができます。
例えば、ソースデータに出現回数が4回の費用フィールドと出現回数が3回の収入フィールドが含まれている場合に、出現回数を4回として両フィールドを設定します。
ノーマライザフィールドマッピングを設定する際に、4回の費用フィールドと3回の収入フィールドを連結できます(1つの不要な収入の出力フィールドは未使用のままになります)。これで、すべての正規化されたデータを同じターゲットに書き込むようマッピングを設定できます。

生成キー

ノーマライザトランスフォーメーションは、正規化されたデータのキー値を生成します。
生成されたキーフィールドは、そのフィールドが複数回出現するよう設定されている場合、[正規化されたフィールド]タブに表示されます。
マッピングタスクは、正規化されたデータについて、次のフィールドを生成します。
生成キー
タスクが入力行を処理するたびに生成するキー値。タスクを実行すると、生成キーは1から開始され、1行処理するたびに1だけ増分されます。
ノーマライザトランスフォーメーションでは、正規化されるすべてのデータに対して1つの生成キーフィールドを使用します。
ノーマライザの生成キーの命名規則は、「GK_<再定義されるフィールド名>」です。
注: 生成されたキーは、詳細モードでは適用できません。
生成カラムID
複数回出現データのインスタンスを表すカラムID値。例えば、4回出現する費用フィールドの場合、1から4の値を使用して出現データの各インスタンスが表現されます。
ノーマライザトランスフォーメーションは、複数回出現するよう設定されている各フィールドについて生成カラムIDを使用します。
ノーマライザの生成カラムIDの命名規則は、「GCID_<再定義されるフィールド名>」です。
詳細クラスタは、生成されたカラムIDフィールドをbigintとして処理します。データ統合サーバーはIDをintegerとして処理します。