データ品質アセットについて
データ品質プロジェクトにおけるアセットとは、データ品質操作の一部または全体を定義する再利用可能なオブジェクトのことです。データ品質のアセットはData Qualityおよびデータ統合で設定して、マッピング内のデータ品質トランスフォーメーションに追加できます。
以下の表に、作成できるデータ品質アセットを示します。
アセット名 | 説明 |
|---|
クレンジング | クレンジングアセットは、データのフォームおよび内容を標準化できる1つ以上のデータトランスフォーメーションステップのセットです。 |
重複排除 | 重複排除アセットはデータセット内のレコード間の類似度を測定し、必要に応じて、類似したレコードを単一の優先レコードに統合します。 |
ラベラー | ラベラーアセットは、データの内容と構造に関する情報を取得します。入力フィールド内のトークンや区切られた値や、入力フィールド内の個々の文字を分析できるよう、ラベラーアセットを設定することができます。 |
解析 | 解析アセットにより、入力フィールドの個別値を特定し、その値を適切な出力フィールドに書き込むことができる一連の操作が定義されます。解析アセットを使用して、データの構造を改善します。 |
ルール仕様 | ルール仕様アセットは、ビジネスルールのデータ要件を論理的な形式で表したものです。 |
ベリファイヤ | ベリファイヤアセットは、住所レコードの正確性と配達可能性を検証します。ベリファイヤを使用して、入力アドレスの精度の確認、アドレス内のエラーの修正、アドレスへの情報の追加を行えます。 |
データ統合でマッピングを設定する際に、対応するデータ品質トランスフォーメーションにデータ品質アセットを追加します。データ品質トランスフォーメーションを使用してマッピングを実行すると、トランスフォーメーションは、アセットで定義したロジックを、トランスフォーメーションに指定されている入力フィールドに適用します。データ品質アセットは、ソースデータを特定したり、ソースデータと直接接続したりしません。
また、他のデータ品質アセットで使用可能なディクショナリを作成することもできます。ディクショナリは、ソースデータの精度または有意性を評価するためにマッピングで読み込み可能な参照データのテーブルです。
データ品質アセットを作成する方法は以下のとおりです:
- •マッピングを設定する際、トランスフォーメーションのオプションを使用してアセットを作成する。
- •Data Qualityにアセットを作成して保存しておき、後日、トランスフォーメーションに追加する。
- •データ統合にアセットを作成して保存しておき、後日、トランスフォーメーションに追加する。
アセットの設定オプションはいずれの場合にも同一です。