例外管理プロセスフロー
データセット内の例外レコードを特定するには、Data Qualityおよびデータプロファイリングで一連の手順を実行します。
次の図に、例外管理プロセスに含まれる手順を示します。
注: プロファイリングタスクと例外タスクは再利用可能なアセットですが、タスクは、選択したデータセットに合わせて調整する必要があります。よくあるのは、例外データを調べるデータセットごとに、固有のプロファイリングタスクと例外タスクを作成することです。
例外管理プロセスには、次の手順が含まれます。
- 1例外レコードを調べるデータセットを特定します。
以前に更新したデータセットを調べることもできますが、これには、データ品質に関する未解決の問題があるレコードが含まれている可能性があります。
- 2Data Qualityで、1つ以上のルール仕様を設定して、データセット内の例外レコードを特定および更新します。
各ルール仕様には、次の特徴があります。
- - ルール仕様には、レコードを例外として識別できる1つ以上の文が含まれています。例えば、レコードにプライマリキーフィールドが含まれており、プライマリキーがNULLである場合、レコードは例外になることがあります。
- - ルール仕様は、出力として次のような例外インジケータをデータに追加します。
- ▪ ステータス値のフィールド。
- ▪ レコードを例外として識別するデータ品質問題の優先度を示すフィールド。
- ▪ データ品質の問題に対する説明が記載されたフィールド。
- - ルール仕様では、例外インジケータに1つの出力セットを使用します。
基本モードでは、プライマリルールセットで例外インジケータを設定します。ルール文内にルール仕様を追加する場合は、子ルール仕様によって例外インジケータの追加出力が作成されないように注意してください。詳細モードでは、ルールロジック全体の論理文で例外インジケータを設定できます。
データで検出されると予想されるデータ品質の問題の数と種類に応じて、ルール仕様を作成します。例えば、ある範囲の問題に関連する複数のルール文を含む、単一のルール仕様を作成できます。または、懸念しているデータ品質の問題の種類ごとに1つのルール仕様を作成することもできます。
- 3データプロファイリングで、データプロファイリングタスクを作成し、1つ以上のルール仕様をルールとしてタスクに追加します。例外レコードを検索して更新するように設定したルール仕様を含めます。例外レコードを含むデータセットを読み取るようにプロファイリングタスクを設定してください。
プロファイリングタスクには複数のルール仕様を追加できます。プロジェクトの要件に最も適した方法でソースデータを調べるルール仕様を1つ以上選択します。
- 4プロファイリングタスクから例外タスクを作成します。例外タスクは、データプロファイリングまたはData Qualityで作成できます。
プロファイリングタスクから例外タスクに1つ以上のルールを追加します。例外レコードを検索して更新するため、以前に設定したルール仕様を含めます。
- 5例外タスクを実行し、[マイジョブ]ページでジョブサマリを確認します。サマリ内のリンクを使用して、例外タスクによって生成されたデータをダウンロードします。
例外タスクは、データプロファイリングまたはData Qualityで実行できます。一度に1つの例外タスクを実行します。
例外ジョブのステータスは、Data Quality、データ統合、およびデータプロファイリングの[マイジョブ]ページで確認できます。
データプロファイリングタスクの詳細については、データプロファイリングのドキュメントにある、データプロファイリングの説明を参照してください。