詳細モードでディクショナリを使用してデータ値を標準化する データ値を標準化するには、ディクショナリに表示される値のインスタンスを検索して、それぞれの値をディクショナリ内の対応する有効な値に置き換えるルールロジックを作成します。
たとえば、銀行は、データの一貫性と均一性を高めるために、顧客の住所データの住所用語を標準化することを決定する場合があります。銀行は、郵便配達業者が好むと思われる短縮形の番地記述子を使用したいと考えています。たとえば、Streetを表すSt、Roadを表すRd、Avenueを表すAveなどです。
データ品質アセットには、住所用語のディクショナリが含まれています。ディクショナリ内の値と一致する入力データ内の値を標準化するルール仕様を作成します。
大まかな説明として、次のような手順を実行します。
1 詳細モードでルール仕様を開きます。
2 ルール仕様に必要な入力と出力が含まれていることを確認します。
ルール仕様に使用できる入力と出力が含まれていない場合は、入力と出力を作成します。ビジネスデータを含むカラムの種類を表す入力ぴょび出力プロパティを設定します。
3 IF文を作成して、ルールがデータを標準化する条件を定義します。
4 THEN文を作成して、データがIF条件を満たした場合に実行するアクションを定義します。
THEN文にreplaceWithDictionary 関数を含めます。必要に応じて関数にパラメータを追加できます。
5 ENDIF要素を追加します。
IF文の書き方 1 ルールエディタで、IF-THEN-ELSE文の IF 要素を入力します。
2 入力名を入力します。
3 入力名をディクショナリ名に関連付けるために、 in 値を追加します。
4 住所用語を含むディクショナリの名前を入力します。
ルールエディタは、入力したテキストに基づいて利用可能なディクショナリを提案します。
THEN文の書き方 1 ルールエディタで、 THEN 要素を入力します。
2 出力名を入力します。
3 = 演算子の値を追加して、出力と追加する関数を関連付けます。
4 入力値と一致するディクショナリ値を返す関数を定義します。
関数を定義するには、STANDARDIZEコマンドとreplaceWithDictionary 関数を使用し、入力名を追加して、ディクショナリを指定します。
IF文で選択したディクショナリを使用します。ルールエディタは、入力したテキストに基づいて、利用可能なディクショナリと関数名を提案します。
ENDIF文の書き方 ルールのロジックを完成させるには、 ENDIF と入力します。 THEN文関数へのオプションのパラメータの追加 必要に応じて、次の1つ以上のパラメータを replaceWithDictionary 関数に追加します。 - 住所用語の優先バージョンを含むディクショナリカラムを指定します。有効なカラムを指定しない場合、ルール仕様はディクショナリの最初のカラムを使用します。- 入力フィールドの個別の値を認識するためにルール仕様で使用する区切り文字を入力します。角括弧内に区切り文字を指定します。区切り文字を指定しない場合、ルール仕様は区切り文字としてスペースを使用します。- 検索操作のスコープを入力します。以下のオプションを設定できます。▪ 任意の場所 。入力フィールドで発生するすべての値のインスタンスを置換します。▪ 開始 。入力フィールドで別の値で始まらないすべての値のインスタンスを置換します。▪ 終了 。入力フィールドで別の値が末尾にないすべての値のインスタンスを置換します。- NULL を入力すると、入力値をカスタム値に置き換えないことを示します。- TRUE を入力すると、関数がディクショナリデータと入力データの間で大文字と小文字を区別した比較を実行することを示します。ルールロジックの例 次の例は、標準化操作を表すルールロジックを示しています。
IF Input in dictionary:MRS.Merge_Cleanse_Strategy.AddressDictionary THEN Output = STANDARDIZE("replaceWithDictionary",Input,dictionary:MRS.Merge_Cleanse_Strategy.AddressDictionary, "Column 1",[" "],"Anywhere","NULL", TRUE) ENDIF