ソースデータセットの特定
例外管理プロセスの最初のステップとして、例外レコードが含まれると予想されるデータセットを選択します。選択したデータセットの構造によって、例外管理で使用するアセットの構成が決まります。
例えば、以前のデータプロセスの出力に対して、データ品質に関する未解決の問題を含むレコードがないかどうかを検索する場合があります。データには、重複した情報を含むレコード、不正確または非標準のデータ値を持つレコード、または1つ以上のカラムにNULL値を持つレコードが含まれる可能性があります。例外管理プロセスを開始するには、対象とするデータ品質の問題が含まれている可能性が高いデータセットのカラムを特定します。設定するアセットのカラムを選択します。
例外管理用に設定するアセットは、次の方法でデータセットを読み取ります。
- •ルール仕様は、1つ以上のカラムを分析し、カラム値の品質を報告する例外値を生成します。プロファイリングタスクでは、1つ以上のルール仕様を選択します。
- •例外タスクは、ルール仕様から報告された例外値に基づいて、データセットからレコードを選択します。ルール仕様を含むプロファイリングタスクから例外タスクを作成します。
注: ルール仕様は、ソースデータセット内のカラムを表す入力を使用して設定します。分析するデータセット内の各カラムの入力を作成します。ルール仕様の入力用に設定するデータプロパティは、データセット内の対応するカラムのデータプロパティと一致する必要があります。