統合プロセスの設定
統合プロセスを定義するには、[統合]タブでオプションを設定します。
1アセットの[統合]タブを選択します。
2統合モードを選択します。モードは、重複排除トランスフォーメーションが重複レコードのセットを1つの優先レコードに統合するために使用する方法を定義します。
次のいずれかのモードを選択できます。
- - 統合なし。トランスフォーメーションは、優先レコードを重複分析で定義される一致レコードのセットから作成しません。
- - 行ベースの統合。トランスフォーメーションは、優先レコードを選択したストラテジに基づいて一致レコードの各セットから選択します。
- - フィールドベースの統合。トランスフォーメーションは、優先レコードをレコードの各フィールドに対して指定したストラテジに基づいて作成します。フィールドベースの統合では、複数のレコードの値を組み合わせ、ソースデータに存在しない優先レコードを作成できます。
3入力レコードのフィールドに対し、行ベースまたはフィールドベースのストラテジを設定します。
4フィールドベースの統合モードを選択した場合、必要に応じて複数のフィールドを統合モデルに追加します。
注: 次のフィールド名は、重複排除アセットで予約されています。
- - ClusterId
- - ClusterSize
- - DriverId
- - DriverScore
- - GroupKey
- - LinkId
- - LinkScore
- - RowId
- - SequenceId
予約された名前を使用してフィールドを作成しないようにしてください。
5トランスフォーメーションを保存します。
統合オプションの詳細については、「
[統合]タブオプション」を参照してください。。