例外管理の概要
例外レコードは、データ品質に関する未解決の問題を含むレコードです。ルール仕様を使用して、例外管理プロセスの一部としてデータセット内の例外レコードを特定できます。
例外管理は、データ品質プロジェクトの終盤で実行する場合があります。例えば、重複するレコードを特定して解決するために、データセットに対して重複排除操作や統合操作を実行することがあります。一方で、重複スコアが操作で定義されている重複排除のしきい値ぎりぎりになっているレコードのステータスが気になる場合もあります。このような場合、スコアが境界線上にあるレコードを特定し、それらのレコードに例外インジケータを追加するルール仕様を設定できます。
または、パターンベースの解析操作を実行して、1つ以上のキーデータカラムにまだNULLデータが含まれていることがわかったとします。このような場合は、NULL値を含むレコードにフラグを付け、それらのレコードに例外インジケータを追加するルール仕様を設定できます。
いずれの場合も、ルール仕様はデータカラムをレコードに追加し、例外インジケータを保存します。レコードの確認にはプロファイルを使用できます。
例外管理プロセスでは、ルール仕様をデータに適用するプロファイリングタスクから例外タスクを作成します。実行時に、例外タスクは、例外インジケータを含むレコードを選択し、それらのレコードをターゲットに書き込みます。これをダウンロードしてさらに処理することが可能です。
データは、Informatica Intelligent Cloud Servicesでさらに処理することもできます。例えば、データセットに対してさらに重複排除操作や統合操作を実行し、より低い重複排除のしきい値を適用できます。または、別のアプリケーションで、レコードを手動で確認して更新することもできます。